Gene Mmcs_1644 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_1644
Symbol
ID	4110479
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	1781842
End bp	1782867
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	68%
IMG OID	638030764
Product	zinc-binding alcohol dehydrogenase
Protein accession	YP_638810
Protein GI	108798613
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.14571
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAGCGA TCGTTCTCAA CGGCACCAAC GACGTCGGTC TGACGTCGGT GCCAGACCCG 
GCGCCGCAGG ACGGTGAGGT CATCATCGAA GTGGCGGCGA CAGGGCTGTG TGGAACTGAC 
CTCCACGAGT ATGTCGCGGG GCCCACCTTC TCGCAGCCGC CGGTGGTGCT CGGTCACGAG 
GTCTCGGGCC GGATCGTGGA GGTCGGAGCG GGCGTCGACC AATCCCGCAT CGGGGAGGGC 
GCCGCGGTGA TCCCGATGGA TTTCTGCGGG AGCTGCCACT ACTGCCACCG GTCGCTCTAC 
CACTTGTGCC AGCGCCCAGG ATGGATCGGC TTCACCCGAA ACGGAGGCCT CGCGAACTAC 
GTCGCAGTGC CCTCTCGGCT CGCAGTCCGA GTGCCGGACG TGGTGGACCT CGAGGAGGCG 
GCGCTGACCG AGCCGACGGC GGTGGCGTTC CACGCGGTGC GGCGAGCGGA ACTGCTCCTC 
GGCGAAACGG TGATGGTCCT CGGTGCCGGG GCACTCGGGC TCACCGTGAT CCAGTGCGCA 
CGCGCGGCCG GAGCTGCGCG AATCTTCGTC ACGGAACCAA GCGGCGTGCG GGCCAGCCTG 
GCGCGCGACC TCGGCGCCAC GTTGGTGCTC GATCCGCATG ACCCCGGGAC CACCGCGTGC 
ATCCTGGAGG AGACCCGCGG TGTAGGGGTG GACGTGGTCT TCCATGTGGC GGGCAGCGCG 
GAGGCGTTCA CACAGGGCCT GGACTGCCTC CGCAAACAGG GCCGTTTCAT GGAGATGTCG 
TCGTGGGCCG GCGCGGCCTC GCTCGATGTC AACCGCCATC TGCTCAAGGA GATTCAGCTC 
CGGATGGTTT TCGGTTACGA CATGTTCGAC GATTTCCCGG CCGTTCTCGC CCTGATCGCC 
GACGGAAAAC TCGCGCTCGC GCCGCAAATC ACCGCTCGAG TCCCGCTGGA CCGCGCCGTC 
AAGGAGGGAT TGGGCGGGCT ATTGGAGGGC CGGGAGGGTC TGGTCAAGGT GCTGGTGAAG 
CCGTGA

Protein sequence

MEAIVLNGTN DVGLTSVPDP APQDGEVIIE VAATGLCGTD LHEYVAGPTF SQPPVVLGHE 
VSGRIVEVGA GVDQSRIGEG AAVIPMDFCG SCHYCHRSLY HLCQRPGWIG FTRNGGLANY 
VAVPSRLAVR VPDVVDLEEA ALTEPTAVAF HAVRRAELLL GETVMVLGAG ALGLTVIQCA 
RAAGAARIFV TEPSGVRASL ARDLGATLVL DPHDPGTTAC ILEETRGVGV DVVFHVAGSA 
EAFTQGLDCL RKQGRFMEMS SWAGAASLDV NRHLLKEIQL RMVFGYDMFD DFPAVLALIA 
DGKLALAPQI TARVPLDRAV KEGLGGLLEG REGLVKVLVK P