Gene EcHS_A0421 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0421
Symbol	adhC
ID	5594614
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	443745
End bp	444854
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	54%
IMG OID	640919606
Product	S-(hydroxymethyl)glutathione dehydrogenase/class III alcohol dehydrogenase
Protein accession	YP_001457191
Protein GI	157159873
COG category	[C] Energy production and conversion
COG ID	[COG1062] Zn-dependent alcohol dehydrogenases, class III
TIGRFAM ID	[TIGR02818] S-(hydroxymethyl)glutathione dehydrogenase/class III alcohol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	58
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATCAC GTGCTGCCGT TGCATTTGCT CCCGGTAAAC CGCTGGAAAT CGTTGAAATT 
GACGTTGCAC CACCGAAAAA AGGTGAAGTG CTGATTAAAG TCACCCATAC CGGCGTTTGC 
CATACCGACG CATTTACCCT CTCTGGGGAT GACCCGGAAG GTGTATTCCC GGTGGTTCTC 
GGTCACGAAG GGGCCGGCGT TGTGGTTGAA GTCGGTGAAG GCGTAACCAG CGTCAAACCT 
GGCGACCATG TGATCCCGCT TTACACCGCG GAGTGCGGCG AGTGTGAGTT CTGTCGTTCT 
GGCAAAACTA ACCTCTGTGT TGCGGTTCGC GAAACCCAGG GTAAAGGCTT GATGCCAGAC 
GGCACCACCC GTTTTTCTTA CAACGGGCAG CCGCTTTATC ACTACATGGG ATGCTCAACA 
TTCAGTGAAT ACACCGTGGT CGCGGAAGTG TCTCTGGCCA AAATTAATCC AGAAGCAAAC 
CATGAACACG TCTGCCTGCT GGGCTGTGGC GTGACCACCG GTATTGGCGC GGTGCACAAC 
ACAGCTAAAG TCCAGCCAGG TGATTCTGTT GCCGTGTTTG GTCTTGGCGC GATTGGTCTG 
GCAGTGGTTC AGGGCGCGCG TCAGGCGAAA GCGGGACGGA TTATCGCTAT CGATACCAAC 
CCGAAGAAAT TCGATCTGGC GCGTCGCTTC GGTGCTACCG ACTGCATTAA CCCGAATGAC 
TACGACAAAC CGATTAAAGA TGTCCTGCTG GATATCAACA AATGGGGTAT CGACCATACC 
TTTGAATGCA TCGGTAACGT CAACGTGATG CGTGCGGCGC TGGAAAGTGC GCACCGCGGC 
TGGGGTCAGT CGGTGATCAT CGGGGTGGCA GGTTCTGGTC AGGAAATCTC CACCCGTCCA 
TTCCAGTTGG TCACTGGTCG CGTATGGAAA GGTTCCGCGT TTGGCGGCGT GAAAGGTCGT 
TCCCAGTTAC CGGGTATGGT TGAAGATGCG ATGAAAGGTG ATATCGATCT GGAACCGTTT 
GTCACGCATA CCATGAGCCT TGATGAAATT AATGACGCCT TCGACCTGAT GCATGAAGGC 
AAATCCATTC GAACCGTAAT TCGTTACTGA

Protein sequence

MKSRAAVAFA PGKPLEIVEI DVAPPKKGEV LIKVTHTGVC HTDAFTLSGD DPEGVFPVVL 
GHEGAGVVVE VGEGVTSVKP GDHVIPLYTA ECGECEFCRS GKTNLCVAVR ETQGKGLMPD 
GTTRFSYNGQ PLYHYMGCST FSEYTVVAEV SLAKINPEAN HEHVCLLGCG VTTGIGAVHN 
TAKVQPGDSV AVFGLGAIGL AVVQGARQAK AGRIIAIDTN PKKFDLARRF GATDCINPND 
YDKPIKDVLL DINKWGIDHT FECIGNVNVM RAALESAHRG WGQSVIIGVA GSGQEISTRP 
FQLVTGRVWK GSAFGGVKGR SQLPGMVEDA MKGDIDLEPF VTHTMSLDEI NDAFDLMHEG 
KSIRTVIRY