Gene EcSMS35_0382 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0382
Symbol	mhpF
ID	6143312
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	397139
End bp	398089
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	55%
IMG OID	641615278
Product	acetaldehyde dehydrogenase
Protein accession	YP_001742485
Protein GI	170682483
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG4569] Acetaldehyde dehydrogenase (acetylating)
TIGRFAM ID	[TIGR03215] acetaldehyde dehydrogenase (acetylating)

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.708162
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAAGC GTAAAGTCGC CATTATCGGT TCAGGCAACA TTGGCACCGA TCTGATGATT 
AAAATTTTGC GTCACGGTCA GCATCTGGAG ATGGCGGTGA TGGTCGGCAT TGATCCTCAG 
TCCGACGGTC TGGCGCGTGC CAGACGTATG GGCGTCGCCA CCACCCATGA AGGGGTGATC 
GGGCTGATGA ACATGCCTGA ATTTGCTGAT ATCGACATTG TATTTGATGC GACCAGCGCG 
GGCGCGCATG TGAAAAACGA TGCCGCTTTG CGCGAAGCGA AACCGGATAT TCGCTTAATT 
GACCTGACGC CTGCTGCCAT CGGCCCTTAC TGCGTGCCGG TCGTTAATCT CGAGGCGAAT 
GTCGATCAAT TGAACGTCAA CATGGTCACC TGCGGCGGCC AGGCCACCAT TCCAATGGTG 
GCGGCAGTTT CACGCGTGGC GCGTGTTCAT TACGCCGAAA TTATCGCTTC TATCGCCAGC 
AAATCTGCCG GACCTGGCAC GCGTGCCAAT ATCGATGAAT TTACGGAAAC CACTTCCCGA 
GCCATTGAAG TGGTGGGCGG CGCGGCAAAA GGGAAGGCAA TTATCGTGCT TAACCCAGCA 
GAGCCACCGT TGATGATGCG TGACACGGTG TATGTATTGA GCGACGAAGC TTCACAAGAT 
GATATCGAAG CCTCAATCAA TGAAATGGCT GAGGCGGTGC AGGCTTACGT ACCGGGATAT 
CGCCTGAAAC AGCGCGTGCA GTTTGAAGTT ATCCCGCAGG ATAAACCGGT TAATTTGCCG 
GGCGTGGGGC AGTTCTCCGG GCTGAAAACG GCTGTCTGGC TGGAAGTCGA AGGCGCAGCA 
CATTATCTGC CTGCCTATGC GGGCAACCTC GACATTATGA CTTCCAGTGC GCTGGCGACA 
GCGGAAAAAA TGGCCCAGTC ACTGGCGCGC AAGGCAGGAG AAGCGGCATG A

Protein sequence

MSKRKVAIIG SGNIGTDLMI KILRHGQHLE MAVMVGIDPQ SDGLARARRM GVATTHEGVI 
GLMNMPEFAD IDIVFDATSA GAHVKNDAAL REAKPDIRLI DLTPAAIGPY CVPVVNLEAN 
VDQLNVNMVT CGGQATIPMV AAVSRVARVH YAEIIASIAS KSAGPGTRAN IDEFTETTSR 
AIEVVGGAAK GKAIIVLNPA EPPLMMRDTV YVLSDEASQD DIEASINEMA EAVQAYVPGY 
RLKQRVQFEV IPQDKPVNLP GVGQFSGLKT AVWLEVEGAA HYLPAYAGNL DIMTSSALAT 
AEKMAQSLAR KAGEAA