Gene Mmcs_5212 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_5212
Symbol
ID	4114040
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	5499371
End bp	5500417
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	71%
IMG OID	638034368
Product	short chain dehydrogenase
Protein accession	YP_642370
Protein GI	108802173
COG category	[R] General function prediction only
COG ID	[COG4221] Short-chain alcohol dehydrogenase of unknown specificity
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCTGCTG CGCGCGGTGT CTGCGGTGTT GCCGCGCCGG GCGCCCAAGA AGTCGGTGTG 
GGTGCCCGCC GCGCCGTCCT ACCTGAGTCA TCAGCTCAGA ATCCGCTGAC GGTGATCGAC 
GATGCGGTGC GGTTGGCCGG TCGGACCGCG ATCCGGTTGG CCCGCGGGAT CCCCGTGGTC 
GGCAACCGGT TCGGCGCACC CCCGCATCTG GACCTGGACG GCCGGGTCGT GTTCGTCACC 
GGCGCGGCAC GCGGGCTCGG CGCGCAGATC GCCCGCCAGG CGCACGCGCG CGGCGCTCAG 
GTGGTGCTCG TCGGGCGCAC CCTGAAACCG CTGGAGGATC TCGCCGCCGA ACTCGGCGAC 
GGGGCGGCCG CCTTCGAGGC CGACGTCACC GACGCCCCGG CTTTGCGACG CGCCGCCGAG 
GGTGCGGTCG CCGCGTTCGG CGGGATCGAC GTCGTGGTGG CCAACGCCGG GATCGCGCCG 
CCGTCGGAGA CGGTCGCCAC CATCGACCCG GACGAGTTCG AGCACACCGT CGAGGTCGAC 
CTGCTCGGCC AGTGGCGCAC CGTACGCGCG ACGCTGCCCG CCGTGATCGC GGCCCGCGGA 
CACATCGCGT TCGTCGGCTC GATCTACGCA TTCTTCAACG GTGTGCTCGC CGCCCCCTAC 
GCGGTCAGTA AGGCCGGGGT GGAACAGCTT TCGCGTGCCC TGCGGGTGGA GCTGGCGCAG 
CACGGTGTCA CCGCGGGCAT CGCCTACCTC GGTTTCATCG ACACCGATCT GACCAGCGAT 
GCCTTCGCCG ACGAACACGC CGCCGCGATC CGTTCGGCGG CGCCCGGTTT CATCACCCGG 
CCGATGAGTG CCGAATCGGC CGCCGCCGCC GTGCTCTCGG GTGTCGAACG CCGTGCCGCG 
CAGGTCACCG CACCCGCGTG GGTGGGTCCG GTGCTGGCGG CGCGCAGCCT CACCACCGCC 
GTGATGGACG ACGTCCTGAT GCACAACCCG CGAGTCAGCG ATGCGGTACT CAGCGCCGAA 
GACGATGTGG CGCAGAGAGA TTCATAA

Protein sequence

MAAARGVCGV AAPGAQEVGV GARRAVLPES SAQNPLTVID DAVRLAGRTA IRLARGIPVV 
GNRFGAPPHL DLDGRVVFVT GAARGLGAQI ARQAHARGAQ VVLVGRTLKP LEDLAAELGD 
GAAAFEADVT DAPALRRAAE GAVAAFGGID VVVANAGIAP PSETVATIDP DEFEHTVEVD 
LLGQWRTVRA TLPAVIAARG HIAFVGSIYA FFNGVLAAPY AVSKAGVEQL SRALRVELAQ 
HGVTAGIAYL GFIDTDLTSD AFADEHAAAI RSAAPGFITR PMSAESAAAA VLSGVERRAA 
QVTAPAWVGP VLAARSLTTA VMDDVLMHNP RVSDAVLSAE DDVAQRDS