Gene Oant_3889 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Oant_3889
Symbol
ID	5381541
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ochrobactrum anthropi ATCC 49188
Kingdom	Bacteria
Replicon accession	NC_009668
Strand	-
Start bp	1298475
End bp	1299689
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	56%
IMG OID	640836574
Product	glycine betaine/L-proline ABC transporter, ATPase subunit
Protein accession	YP_001372423
Protein GI	153011209
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4175] ABC-type proline/glycine betaine transport system, ATPase component
TIGRFAM ID	[TIGR01186] glycine betaine/L-proline transport ATP binding subunit

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.962133
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATGGTA TTTTATACAA GGAAGAAAGT ATGAAGTCGC CGGCTGAGAC GAAAATAAGC 
TTGAAGAGCG TTTTTAAAGT CTTCGGCGAT GACCCGGAGC GTGCAATGCA AGAATTGCGC 
GCAGGTAAAT CAAAAACCCA GATTCACAGC GAACTTGGCG CAACAATCGG CGTCGATGAT 
GCGACCTTCG ACATCTATGA AGGCGAAGTA TTCGTTATTA TGGGCCTCTC CGGCTCGGGC 
AAATCCACGC TTCTGCGTCT GCTCAATCGC TTGATCGAAC CGACTGTCGG TTCCATCGAA 
GTGGACGGCC GCGATATCGT CAAAATGACG AAGCGCGAGC TGATCGATCT TCGTCGTCGC 
GACATGAGCA TGGTGTTCCA GTCTTTTGCG CTCCTGCCCA ATCGTTCGGT TCTGAACAAT 
GCGTCGTTCG GTCTCGAAGT GGCCGGAATG GGTGAGGCGG AACGTCACCA GAAGGCACTG 
AAAGCACTCG CTGCGGTTGG TCTTGAACCA TATGCTCACA GTATGCCGGA TCAGCTTTCC 
GGCGGTATGA AGCAACGTGT CGGACTGGCG CGCGCGCTGG CAAGCGAGCC GACCATTCTT 
CTGATGGACG AGGCATTTTC TGCCCTTGAT CCGCTGATCC GCACCGAAAT GCAGGACGAA 
CTCAAGCGGC TGCAGGCTGA ACATAGCCGG ACGATCATTT TCGTGAGCCA TGATCTGGAC 
GAAGCCATGC GTATCGGTGA CCGTATCTGC ATCATGCAGC ACGGCAAGGT CGTCCAGGTG 
GGAACGCCGA ACGAAATCGT GTCCGCACCG GCCAACGATT ATGTTCGTTC CTTCTTCCGC 
AATGTCGATG TGTCCCGCGT ATTCAAAGCC GCCGATGTGG CTCGCGACGA CGAGCTGATC 
GTGTTTGAAC CCGAACAGCT GGCGACGGCG CTCGAGCGTT TCGACGCGAG CGGCAAGACG 
TTCGGCGTGT TGATCGATGC CGACCGCACA TATCGCGGCA TGGTCAGTCG TGATGCGCTG 
GCAAAGGGTG CTGTCGCGCA GGATGGCGAG AGACTGGATA GCGTCTCTGC TATCGAAGCC 
GAAGCGCCGC TTGCCGGATT GCTGACACAG GTGGCGGAAA GCCCTTGGCC GGTCCCGGTC 
ACTGACCGCC AGAACCGTTA TGTCGGTGCT ATCAGCAAAT CGGCCTTGCT TGAAACGCTT 
GGTCGCGCGG GCTGA

Protein sequence

MHGILYKEES MKSPAETKIS LKSVFKVFGD DPERAMQELR AGKSKTQIHS ELGATIGVDD 
ATFDIYEGEV FVIMGLSGSG KSTLLRLLNR LIEPTVGSIE VDGRDIVKMT KRELIDLRRR 
DMSMVFQSFA LLPNRSVLNN ASFGLEVAGM GEAERHQKAL KALAAVGLEP YAHSMPDQLS 
GGMKQRVGLA RALASEPTIL LMDEAFSALD PLIRTEMQDE LKRLQAEHSR TIIFVSHDLD 
EAMRIGDRIC IMQHGKVVQV GTPNEIVSAP ANDYVRSFFR NVDVSRVFKA ADVARDDELI 
VFEPEQLATA LERFDASGKT FGVLIDADRT YRGMVSRDAL AKGAVAQDGE RLDSVSAIEA 
EAPLAGLLTQ VAESPWPVPV TDRQNRYVGA ISKSALLETL GRAG