Gene EcSMS35_0387 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0387
Symbol	adhC
ID	6143543
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	402177
End bp	403286
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	54%
IMG OID	641615283
Product	S-(hydroxymethyl)glutathione dehydrogenase/class III alcohol dehydrogenase
Protein accession	YP_001742490
Protein GI	170682377
COG category	[C] Energy production and conversion
COG ID	[COG1062] Zn-dependent alcohol dehydrogenases, class III
TIGRFAM ID	[TIGR02818] S-(hydroxymethyl)glutathione dehydrogenase/class III alcohol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.41926
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATCAC GTGCTGCCGT TGCATTTGCT CCCGGTAAAC CGCTGGAAAT CGTTGAAATT 
GACGTTGCAC CACCGAAAAA AGGTGAAGTG CTGATTAAAG TCACCCATAC CGGCGTTTGC 
CATACCGACG CATTTACCCT CTCCGGCGAT GACCCGGAAG GTGTATTCCC GGTAGTTCTC 
GGTCACGAAG GGGCCGGCGT TGTGGTTGAA GTCGGTGAAG GCGTAACCAG CGTCAAACCT 
GGCGACCATG TGATCCCGCT TTACACCGCA GAGTGCGGCG AGTGTGAGTT CTGTCGTTCC 
GGCAAAACCA ACCTCTGTGT TGCGGTTCGC GAAACCCAGG GTAAAGGCCT GATGCCAGAC 
GGCACCACCC GTTTTTCTTA CAACGGGCAG CCGCTTTATC ACTACATGGG ATGCTCTACA 
TTCAGTGAAT ACACCGTGGT CGCGGAAGTG TCTCTGGCCA AAATTAATCC AGAGGCAAAC 
CACGAACACG TCTGCCTGCT GGGCTGTGGC GTGACCACCG GTATTGGCGC GGTACACAAC 
ACGGCTAAAG TCCAGCCAGA TGATTCTGTT GCCGTATTTG GTCTTGGCGC GATTGGTCTG 
GCAGTGGTTC AGGGCGCGCG TCAGGCGAAA GCGGGACGGA TTATCGCTAT CGATACGAAC 
CCGAAGAAAT TCGATCTGGC GCGTCGCTTC GGTGCTACCG ACTGCATTAA CCCGAATGAC 
TACGACAAAC CGATTAAAGA TGTCCTGCTG GATATCAACA AATGGGGTAT CGACCATACC 
TTTGAATGCA TCGGTAACGT CAACGTGATG CGTGCGGCGC TGGAAAGTGC GCACCGCGGC 
TGGGGTCAGT CGGTGATCAT CGGGGTAGCT GGTTCTGGTC AGGAAATCTC CACCCGTCCA 
TTCCAGTTGG TCACCGGTCG CGTATGGAAA GGTTCCGCGT TTGGCGGCGT GAAAGGTCGT 
TCCCAGTTAC CGGGTATGGT TGAAGATGCG ATGAAAGGCG ATATCGATCT GGAACCGTTT 
GTCACGCATA CCATGAGCCT GGATGAAATT AATGACGCCT TTGACCTGAT GCATGAAGGC 
AAATCCATTC GAACCGTAAT TCGTTACTGA

Protein sequence

MKSRAAVAFA PGKPLEIVEI DVAPPKKGEV LIKVTHTGVC HTDAFTLSGD DPEGVFPVVL 
GHEGAGVVVE VGEGVTSVKP GDHVIPLYTA ECGECEFCRS GKTNLCVAVR ETQGKGLMPD 
GTTRFSYNGQ PLYHYMGCST FSEYTVVAEV SLAKINPEAN HEHVCLLGCG VTTGIGAVHN 
TAKVQPDDSV AVFGLGAIGL AVVQGARQAK AGRIIAIDTN PKKFDLARRF GATDCINPND 
YDKPIKDVLL DINKWGIDHT FECIGNVNVM RAALESAHRG WGQSVIIGVA GSGQEISTRP 
FQLVTGRVWK GSAFGGVKGR SQLPGMVEDA MKGDIDLEPF VTHTMSLDEI NDAFDLMHEG 
KSIRTVIRY