Gene Oant_3909 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Oant_3909
Symbol
ID	5381385
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ochrobactrum anthropi ATCC 49188
Kingdom	Bacteria
Replicon accession	NC_009668
Strand	+
Start bp	1319601
End bp	1320617
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	58%
IMG OID	640836594
Product	putative simple sugar transport system substrate-binding protein
Protein accession	YP_001372443
Protein GI	153011229
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.344207
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACTCG CAAGAATCCT TTTCGCATCC GCAGCACTGG CAGGCGTTCT CGCCGCTGGC 
AGCGCGATGG CTGACACATC GTCGAAGAAG ATTGCATTCT CCAACAATTA TGCTGGCAAC 
TCATGGCGCC AGGCCATGCT GCAAAGCTGG GACAAGATCA CCAAGGAAGC CGTGAAGGCC 
GGTGTGGTCG CTGCGGCTGA CCCGTTCACG ACGGCTGAAA ATCAGGCCAC AGAGCAGGCC 
GCACAGATCC AGAACATGAT CCTGCAAGGC TATGATGCCA TCGTCATCAA TGCCGCTTCG 
CCAACCGCTT TGAACGGTGC AATCAAGGAA GCCTGCGATG CGGGCATCAC GGTCGTTTCC 
TTTGACGGCA CCGTCACGGA GCCTTGCGCA TGGCGCATCG CGGTCGATTT CAAGGCAATG 
GGCGAAGGCC AGATCGATTA TCTCGCAAAG CGCTTCCCCG ATGGCGGCAA CCTGCTTGAA 
ATTCGCGGTC TTGCCGGTGT TTCGGTCGAT GACAATATCC ATGCTGGCAT CGAAGAAGGC 
GTGAAGAAGC ATCCGAAATT CAAGATCGTC GGCTCCGTCA ATGGCGACTG GGCGGCGGAC 
GTGGCACAGC GTGCCGTCGC TGGCATCCTC CCAAGCCTGC CGAAAATCGA CGCAGTCGTG 
ACGCAGGGCG GCGACGGTTA TGGTGCTGCG CAGGCCTTCG CCGCCGCCAA GCGCGAAACG 
CCGATCATCA TCATGGGCAA CCGTGAAGAC GAACTGCAGT GGTGGAAGCA ACAGAAGGAC 
GCCAATGGCT ACGAAACCAT GTCGGTTTCG ATTGCACCCG GCGTTTCAAC GCTTGCTTTC 
TGGGTTGCCC AGCAGATTCT CGACGGCAAG GACGTGAAGA AGGACCTCGT GGTTCCGTTC 
CTCAGCGTCA GCCAGGAATC GCTCGACAAG GATCTGGCCA ACACCCAGAA GGGTGGCGTC 
GCCAATGTCG AATATTCGCT GGAAGACGCG CAGAAGGTCA TCGACGCGGC CAAGTAA

Protein sequence

MKLARILFAS AALAGVLAAG SAMADTSSKK IAFSNNYAGN SWRQAMLQSW DKITKEAVKA 
GVVAAADPFT TAENQATEQA AQIQNMILQG YDAIVINAAS PTALNGAIKE ACDAGITVVS 
FDGTVTEPCA WRIAVDFKAM GEGQIDYLAK RFPDGGNLLE IRGLAGVSVD DNIHAGIEEG 
VKKHPKFKIV GSVNGDWAAD VAQRAVAGIL PSLPKIDAVV TQGGDGYGAA QAFAAAKRET 
PIIIMGNRED ELQWWKQQKD ANGYETMSVS IAPGVSTLAF WVAQQILDGK DVKKDLVVPF 
LSVSQESLDK DLANTQKGGV ANVEYSLEDA QKVIDAAK