Gene EcDH1_2026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_2026
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	2184215
End bp	2185588
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	52%
IMG OID
Product	sugar (Glycoside-Pentoside-Hexuronide) transporter
Protein accession	ACX39683
Protein GI	260449261
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.232812
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCAAC AACTCTCCTG GCGCACCATC GTCGGCTACA GCCTCGGTGA CGTCGCCAAT 
AACTTCGCCT TCGCAATGGG GGCGCTCTTC CTGTTGAGTT ACTACACCGA CGTCGCTGGC 
GTCGGTGCCG CTGCGGCGGG CACCATGCTG TTACTGGTGC GGGTATTCGA TGCCTTCGCC 
GACGTCTTTG CCGGACGAGT GGTGGACAGT GTGAATACCC GCTGGGGAAA ATTCCGCCCG 
TTTTTACTCT TCGGTACTGC GCCGTTAATG ATCTTCAGCG TGCTGGTATT CTGGGTGCTG 
ACCGACTGGA GCCATGGTAG CAAAGTGGTG TATGCATATT TGACCTACAT GGGCCTCGGG 
CTTTGCTACA GCCTGGTGAA TATTCCTTAT GGTTCACTTG CTACCGCGAT GACCCAACAA 
CCACAATCCC GCGCCCGTCT GGGCGCGGCT CGTGGGATTG CCGCTTCATT GACCTTTGTC 
TGCCTGGCAT TTCTGATAGG ACCGAGCATT AAGAACTCCA GCCCGGAAGA GATGGTGTCG 
GTATACCATT TCTGGACAAT TGTGCTGGCG ATTGCCGGAA TGGTGCTTTA CTTCATCTGC 
TTCAAATCGA CGCGTGAGAA TGTGGTACGT ATCGTTGCGC AGCCGTCATT GAATATCAGT 
CTGCAAACCC TGAAACGGAA TCGCCCGCTG TTTATGTTGT GCATCGGTGC GCTGTGTGTG 
CTGATTTCGA CCTTTGCGGT CAGCGCCTCG TCGTTGTTCT ACGTGCGCTA TGTGTTAAAT 
GATACCGGGC TGTTCACTGT GCTGGTACTG GTGCAAAACC TGGTTGGTAC TGTGGCATCG 
GCACCGCTGG TGCCGGGGAT GGTCGCGAGG ATCGGTAAAA AGAATACCTT CCTGATTGGC 
GCTTTGCTGG GAACCTGCGG TTATCTGCTG TTCTTCTGGG TTTCCGTCTG GTCACTGCCG 
GTGGCGTTGG TTGCGTTGGC CATCGCTTCA ATTGGTCAGG GCGTTACCAT GACCGTGATG 
TGGGCGCTGG AAGCTGATAC CGTAGAATAC GGTGAATACC TGACCGGCGT GCGAATTGAA 
GGGCTCACCT ATTCACTATT CTCATTTACC CGTAAATGCG GTCAGGCAAT CGGAGGTTCA 
ATTCCTGCCT TTATTTTGGG GTTAAGCGGA TATATCGCCA ATCAGGTGCA AACGCCGGAA 
GTTATTATGG GCATCCGCAC ATCAATTGCC TTAGTACCTT GCGGATTTAT GCTACTGGCA 
TTCGTTATTA TCTGGTTTTA TCCGCTCACG GATAAAAAAT TCAAAGAAAT CGTGGTTGAA 
ATTGATAATC GTAAAAAAGT GCAGCAGCAA TTAATCAGCG ATATCACTAA TTAA

Protein sequence

MNQQLSWRTI VGYSLGDVAN NFAFAMGALF LLSYYTDVAG VGAAAAGTML LLVRVFDAFA 
DVFAGRVVDS VNTRWGKFRP FLLFGTAPLM IFSVLVFWVL TDWSHGSKVV YAYLTYMGLG 
LCYSLVNIPY GSLATAMTQQ PQSRARLGAA RGIAASLTFV CLAFLIGPSI KNSSPEEMVS 
VYHFWTIVLA IAGMVLYFIC FKSTRENVVR IVAQPSLNIS LQTLKRNRPL FMLCIGALCV 
LISTFAVSAS SLFYVRYVLN DTGLFTVLVL VQNLVGTVAS APLVPGMVAR IGKKNTFLIG 
ALLGTCGYLL FFWVSVWSLP VALVALAIAS IGQGVTMTVM WALEADTVEY GEYLTGVRIE 
GLTYSLFSFT RKCGQAIGGS IPAFILGLSG YIANQVQTPE VIMGIRTSIA LVPCGFMLLA 
FVIIWFYPLT DKKFKEIVVE IDNRKKVQQQ LISDITN