Gene EcolC_1734 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1734
Symbol
ID	6065782
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1930562
End bp	1931551
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	52%
IMG OID	641601149
Product	monosaccharide-transporting ATPase
Protein accession	YP_001724711
Protein GI	170019757
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.783762
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACAAAT TTACTAAAGC CCTGGCAGCC ATTGGTCTGG CAGCCGTTAT GTCACAATCC 
GCTATGGCGG AGAACCTGAA GCTCGGTTTT CTGGTGAAGC AACCGGAAGA GCCGTGGTTC 
CAGACCGAAT GGAAGTTTGC CGATAAAGCC GGGAAGGATT TAGGGTTTGA GGTTATTAAG 
ATTGCCGTGC CGGATGGCGA AAAAACATTG AACGCGATCG ACAGCCTGGC TGCCAGTGGC 
GCAAAAGGTT TCGTTATTTG TACTCCGGAC CCCAAACTCG GCTCTGCCAT CGTCGCGAAA 
GCGCGTGGCT ACGATATGAA AGTCATTGCC GTGGATGACC AGTTTGTTAA CGCCAAAGGT 
AAGCCAATGG ATACCGTTCC GCTGGTGATG ATGGCGGCGA CTAAAATTGG CGAACGTCAG 
GGCCAGGAAC TGTATAAAGA GATGCAGAAA CGTGGCTGGG ATGTCAAAGA AAGCGCGGTG 
ATGGCGATTA CCGCCAACGA ACTGGATACC GCCCGCCGCC GTACTACGGG ATCTATGGAT 
GCGCTGAAAG CGGCCGGATT CCCGGAAAAA CAAATTTATC AGGTACCTAC CAAATCTAAC 
GACATCCCGG GGGCATTTGA CGCTGCCAAC TCAATGCTGG TTCAACATCC GGAAGTTAAA 
CATTGGCTGA TCGTCGGTAT GAACGACAGC ACCGTGCTGG GCGGCGTACG CGCGACGGAA 
GGTCAGGGCT TTAAAGCGGC CGATATCATC GGCATTGGCA TTAACGGTGT GGATGCGGTG 
AGCGAACTGT CTAAAGCACA GGCAACCGGC TTCTACGGTT CCCTGCTGCC AAGCCCGGAC 
GTACATGGCT ATAAATCCAG CGAAATGCTT TACAACTGGG TAGCAAAAGA CGTTGAACCG 
CCAAAATTTA CCGAAGTTAC CGACGTGGTA CTGATCACGC GTGACAACTT TAAAGAAGAA 
CTGGAGAAAA AAGGTTTAGG CGGTAAGTAA

Protein sequence

MHKFTKALAA IGLAAVMSQS AMAENLKLGF LVKQPEEPWF QTEWKFADKA GKDLGFEVIK 
IAVPDGEKTL NAIDSLAASG AKGFVICTPD PKLGSAIVAK ARGYDMKVIA VDDQFVNAKG 
KPMDTVPLVM MAATKIGERQ GQELYKEMQK RGWDVKESAV MAITANELDT ARRRTTGSMD 
ALKAAGFPEK QIYQVPTKSN DIPGAFDAAN SMLVQHPEVK HWLIVGMNDS TVLGGVRATE 
GQGFKAADII GIGINGVDAV SELSKAQATG FYGSLLPSPD VHGYKSSEML YNWVAKDVEP 
PKFTEVTDVV LITRDNFKEE LEKKGLGGK