Gene EcDH1_2121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_2121
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	2263775
End bp	2265163
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	53%
IMG OID
Product	Aldehyde Dehydrogenase
Protein accession	ACX39776
Protein GI	260449354
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0323198
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCATTA CTCCGGCAAC TCATGCAATT TCGATAAATC CTGCCACGGG TGAACAACTT 
TCTGTGCTGC CGTGGGCTGG CGCTGACGAT ATCGAAAACG CACTTCAGCT GGCGGCAGCA 
GGCTTTCGCG ACTGGCGCGA GACAAATATA GATTATCGTG CTGAAAAACT GCGTGATATC 
GGTAAGGCTC TGCGCGCTCG TAGCGAAGAA ATGGCGCAAA TGATCACCCG CGAAATGGGC 
AAACCAATCA ACCAGGCGCG CGCTGAAGTG GCGAAATCGG CGAATTTGTG TGACTGGTAT 
GCAGAACATG GTCCGGCAAT GCTGAAGGCG GAACCTACGC TGGTGGAAAA TCAGCAGGCG 
GTTATTGAGT ATCGACCGTT GGGGACGATT CTGGCGATTA TGCCGTGGAA TTTTCCGTTA 
TGGCAGGTGA TGCGTGGCGC TGTTCCCATC ATTCTTGCAG GTAACGGCTA CTTACTTAAA 
CATGCGCCGA ATGTGATGGG CTGTGCACAG CTCATTGCCC AGGTGTTTAA AGATGCGGGT 
ATCCCACAAG GCGTATATGG CTGGCTGAAT GCCGACAACG ACGGTGTCAG TCAGATGATT 
AAAGACTCGC GCATTGCTGC TGTCACGGTG ACCGGAAGTG TTCGTGCGGG AGCGGCTATT 
GGCGCACAGG CTGGAGCGGC ACTGAAAAAA TGCGTACTGG AACTGGGCGG TTCGGATCCG 
TTTATTGTGC TTAACGATGC CGATCTGGAA CTGGCGGTGA AAGCGGCGGT AGCCGGACGT 
TATCAGAATA CCGGACAGGT ATGTGCAGCG GCAAAACGCT TTATTATCGA AGAGGGAATT 
GCTTCGGCAT TTACCGAACG TTTTGTGGCA GCTGCGGCAG CCTTGAAAAT GGGCGATCCC 
CGTGACGAAG AGAACGCTCT CGGACCAATG GCTCGTTTTG ATTTACGTGA TGAGCTGCAT 
CATCAGGTGG AGAAAACCCT GGCGCAGGGT GCGCGTTTGT TACTGGGCGG GGAAAAGATG 
GCTGGGGCAG GTAACTACTA TCCGCCAACG GTTCTGGCGA ATGTTACCCC AGAAATGACC 
GCGTTTCGGG AAGAAATGTT TGGCCCCGTT GCGGCAATCA CCATTGCGAA AGATGCAGAA 
CATGCACTGG AACTGGCTAA TGATAGTGAG TTCGGCCTTT CAGCGACCAT TTTTACCACT 
GACGAAACAC AGGCCAGACA GATGGCGGCA CGTCTGGAAT GCGGTGGGGT GTTTATCAAT 
GGTTATTGTG CCAGCGACGC GCGAGTGGCC TTTGGTGGCG TGAAAAAGAG TGGCTTTGGT 
CGTGAGCTTT CCCATTTCGG CTTACACGAA TTCTGTAATA TCCAGACGGT GTGGAAAGAC 
CGGATCTGA

Protein sequence

MTITPATHAI SINPATGEQL SVLPWAGADD IENALQLAAA GFRDWRETNI DYRAEKLRDI 
GKALRARSEE MAQMITREMG KPINQARAEV AKSANLCDWY AEHGPAMLKA EPTLVENQQA 
VIEYRPLGTI LAIMPWNFPL WQVMRGAVPI ILAGNGYLLK HAPNVMGCAQ LIAQVFKDAG 
IPQGVYGWLN ADNDGVSQMI KDSRIAAVTV TGSVRAGAAI GAQAGAALKK CVLELGGSDP 
FIVLNDADLE LAVKAAVAGR YQNTGQVCAA AKRFIIEEGI ASAFTERFVA AAAALKMGDP 
RDEENALGPM ARFDLRDELH HQVEKTLAQG ARLLLGGEKM AGAGNYYPPT VLANVTPEMT 
AFREEMFGPV AAITIAKDAE HALELANDSE FGLSATIFTT DETQARQMAA RLECGGVFIN 
GYCASDARVA FGGVKKSGFG RELSHFGLHE FCNIQTVWKD RI