Gene EcDH1_4110 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_4110
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	4448704
End bp	4450107
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	45%
IMG OID
Product	sugar (Glycoside-Pentoside-Hexuronide) transporter
Protein accession	ACX41710
Protein GI	260451288
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	59
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGACC ATAATCCACT GACATTAAAA CTGAATCTGC GGGAAAAAAT CGCCTATGGT 
ATGGGCGACG TCGGTTCGAA TTTAATGCTC TGCATCGGTA CTCTGTATCT CCTCAAATTT 
TATACCGATG AATTAGGGAT GCCTGCTTAC TATGGCGGGA TTATCTTTCT GGTGGCGAAG 
TTTTTTACCG CGTTTACCGA TATGCTCACC GGATTTTTAC TCGACTCGCG GAAAAATATT 
GGGCCTAAAG GCAAATTTCG TCCCTTTATT TTATATGCAG CGGTTCCGGC GGCGTTAATT 
GCAACGCTCC AGTTTATCGC CACCACCTTT TGTTTGCCGG TTAAAACGAC GATTGCCACC 
GCGCTGTTTA TGATGTTTGG ACTTTCATAC AGTCTGATGA ACTGCTCGTA TGGTGCGATG 
ATCCCGGCAA TTACCAAAAA CCCGAATGAG CGCGCGCAGC TCGCGGCTTA CCGCCAGGGT 
GGTGCAACCA TAGGGCTATT GATTTGTACC GTGGCGTTTA TTCCGTTGCA GTCGCTTTTT 
TCTGACTCAA CCGTCGGTTA TGCCTGTGCG GCACTTATGT TCTCCATTGG CGGCTTTATT 
TTTATGATGC TGTGCTACAG AGGCGTCAAA GAGCATTATG TGGACACAAC GCCAACCGGA 
CATAAAGCCA GTATTCTCAA ATCATTTTGC GCGATATTTC GGAATCCGCC ATTGCTGGTT 
TTATGCATTG CTAACTTGTG TACCCTGGCG GCATTTAATA TCAAACTGGC GATTCAGGTC 
TATTACACCC AGTATGTGCT GAATGATATT AATTTATTGT CGTGGATGGG ATTCTTCAGT 
ATGGGATGCA TCCTCATCGG CGTATTACTG GTGCCATTAA CTGTAAAATG TTTTGGTAAA 
AAACAGGTTT ATCTGGCTGG CATGGTGCTG TGGGCGGTGG GTGATATACT GAATTATTTC 
TGGGGAAGTA ACTCTTTCAC TTTCGTCATG TTCTCTTGTG TCGCCTTTTT TGGCACGGCC 
TTTGTAAACA GCCTGAACTG GGCACTGGTA CCAGATACCG TAGATTACGG TGAATGGAAA 
ACCGGTATTC GTGCCGAAGG TTCTGTTTAT ACCGGTTATA CCTTCTTTCG TAAAATTTCT 
GCCGCACTTG CTGGCTTCTT GCCAGGCATT ATGCTGACGC AAATTGGTTA TGTTCCCAAC 
ATCGCGCAAA GCGATGCGAC ATTACAGGGT TTGCGTCAGC TCATTTTTAT CTGGCCTTGT 
GCACTGGCAA TTATTGCTGC ATTGACGATG GGATTCTTTT ACACACTCAA TGAAAAACGG 
TTTGCATTGA TTATTGAGGA AATCAACCAA CGCAAAAATA AAGAGATGGC GACAGAAGAA 
AAAACGGCTT CCGTAACGTT ATAA

Protein sequence

MSDHNPLTLK LNLREKIAYG MGDVGSNLML CIGTLYLLKF YTDELGMPAY YGGIIFLVAK 
FFTAFTDMLT GFLLDSRKNI GPKGKFRPFI LYAAVPAALI ATLQFIATTF CLPVKTTIAT 
ALFMMFGLSY SLMNCSYGAM IPAITKNPNE RAQLAAYRQG GATIGLLICT VAFIPLQSLF 
SDSTVGYACA ALMFSIGGFI FMMLCYRGVK EHYVDTTPTG HKASILKSFC AIFRNPPLLV 
LCIANLCTLA AFNIKLAIQV YYTQYVLNDI NLLSWMGFFS MGCILIGVLL VPLTVKCFGK 
KQVYLAGMVL WAVGDILNYF WGSNSFTFVM FSCVAFFGTA FVNSLNWALV PDTVDYGEWK 
TGIRAEGSVY TGYTFFRKIS AALAGFLPGI MLTQIGYVPN IAQSDATLQG LRQLIFIWPC 
ALAIIAALTM GFFYTLNEKR FALIIEEINQ RKNKEMATEE KTASVTL