Gene Mmcs_5437 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_5437
Symbol
ID	4114522
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008147
Strand	+
Start bp	18249
End bp	19196
Gene Length	948 bp
Protein Length	315 aa
Translation table	11
GC content	61%
IMG OID	638034592
Product	acetaldehyde dehydrogenase
Protein accession	YP_642593
Protein GI	108802397
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG4569] Acetaldehyde dehydrogenase (acetylating)
TIGRFAM ID	[TIGR03215] acetaldehyde dehydrogenase (acetylating)

Plasmid Coverage information

Num covering plasmid clones	62
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.747247
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCACT CCAAGGTCGC AGTCATCGGT TCGGGCAACA TCGGTACCGA CCTAGTCGTC 
AAATTGAAGA AGTTGGCGAC CAACGTCGAG ATCGCTGTGT TGGTCGGCAT CGACCCGTCG 
TCGGATGGTC TGGCTCGTGC CCGCCGGATG GGTATCGGCA CAGTCGACAC CGGTGTGCAG 
GGTTTGATCG AGCACGCCGA ATTCGATGAG ATCGACATCA TCTTCGATTC CACGTCGGCG 
AAAGCGCATC TCGTCAACGA GGAAGCGTTG CGTACCTTTG GCAAGCGGCT GATCGACCTG 
ACTCCCGCTG CAGTCGGTCC CTACGTCGTG CCTGCCGTGA ATCTCGACGA CCACTTGGGT 
GCGCCGAACG TCAACATGGT CACCTGCGGC GGTCAGGCGA CGATCCCTAT CGTCGCGGCG 
ATCTCATCGG TCACGGCGGT GCACTACGCC GAGATCGTCG CCTCGATCGC GTCGAAATCG 
GCGGGTCCGG GAACACGGTC GAATATCGAT GAATTCACCC AAACCACCTC AGCGGCAATC 
GAAAAGGTAG GCGGAGCAGC ACACGGCAAG GCGATCATCG TTCTCAATCC CGCGGAGCCA 
CCGTTGATCA TGCGCGATAC CGTCTTGGCT CTCGTGACGG ATCCCGATCA GAACCGCATC 
AGGCAGTCGG TTATAGACAT GGTGGAGAAG GTGTCGGCCT ACGTGCCGGG CTACCGACTC 
AAACAGGAAG TGCAGTTCAC CCAGCTCGAC GACGCCGAGT CCGTCGCGAC CCTGACCGGA 
GGAGTCGACA AGGGGCCCGG GCTGTGGAAG GTGGCGGTCT TCCTAGAAGT CGAGGGTGCC 
GCGCACTACT TGCCGGCCTA CGCCGGCAAT CTCGACATCA TGACCTCGGC GGCACTACAG 
GTGGCCGAGC GGATCGCGGC GAACACTGTG CAGGAGGCCA CGCGATGA

Protein sequence

MSHSKVAVIG SGNIGTDLVV KLKKLATNVE IAVLVGIDPS SDGLARARRM GIGTVDTGVQ 
GLIEHAEFDE IDIIFDSTSA KAHLVNEEAL RTFGKRLIDL TPAAVGPYVV PAVNLDDHLG 
APNVNMVTCG GQATIPIVAA ISSVTAVHYA EIVASIASKS AGPGTRSNID EFTQTTSAAI 
EKVGGAAHGK AIIVLNPAEP PLIMRDTVLA LVTDPDQNRI RQSVIDMVEK VSAYVPGYRL 
KQEVQFTQLD DAESVATLTG GVDKGPGLWK VAVFLEVEGA AHYLPAYAGN LDIMTSAALQ 
VAERIAANTV QEATR