Gene Mkms_5300 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_5300
Symbol
ID	4612983
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	5536993
End bp	5538039
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	71%
IMG OID	639794996
Product	short chain dehydrogenase
Protein accession	YP_941278
Protein GI	119871326
COG category	[R] General function prediction only
COG ID	[COG4221] Short-chain alcohol dehydrogenase of unknown specificity
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCTGCTG CGCGCGGTGT CTGCGGTGTT GCCGCGCCGG GCGCCCAAGA AGTCGGTGTG 
GGTGCCCGCC GCGCCGTCCT ACCTGAGTCA TCAGCTCAGA ATCCGCTGAC GGTGATCGAC 
GATGCGGTGC GGTTGGCCGG TCGGACCGCG ATCCGGTTGG CCCGCGGGAT CCCCGTGGTC 
GGCAACCGGT TCGGCGCACC CCCGCATCTG GACCTGGACG GCCGGGTCGT GTTCGTCACC 
GGCGCGGCAC GCGGGCTCGG CGCGCAGATC GCCCGCCAGG CGCACGCGCG CGGCGCTCAG 
GTGGTGCTCG TCGGGCGCAC CCTGAAACCG CTGGAGGATC TCGCCGCCGA ACTCGGCGAC 
GGGGCGGCCG CCTTCGAGGC CGACGTCACC GACGCCCCGG CTTTGCGACG CGCCGCCGAG 
GGTGCGGTCG CCGCGTTCGG CGGGATCGAC GTCGTGGTGG CCAACGCCGG GATCGCGCCG 
CCGTCGGAGA CGGTCGCCAC CATCGACCCG GACGAGTTCG AGCACACCGT CGAGGTCGAC 
CTGCTCGGCC AGTGGCGCAC CGTACGCGCG ACGCTGCCCG CCGTGATCGC GGCCCGCGGA 
CACATCGCGT TCGTCGGCTC GATCTACGCA TTCTTCAACG GTGTGCTCGC CGCCCCCTAC 
GCGGTCAGTA AGGCCGGGGT GGAACAGCTT TCGCGTGCCC TGCGGGTGGA GCTGGCGCAG 
CACGGTGTCA CCGCGGGCAT CGCCTACCTC GGTTTCATCG ACACCGATCT GACCAGCGAT 
GCCTTCGCCG ACGAACACGC CGCCGCGATC CGTTCGGCGG CGCCCGGTTT CATCACCCGG 
CCGATGAGTG CCGAATCGGC CGCCGCCGCC GTGCTCTCGG GTGTCGAACG CCGTGCCGCG 
CAGGTCACCG CACCCGCGTG GGTGGGTCCG GTGCTGGCGG CGCGCAGCCT CACCACCGCC 
GTGATGGACG ACGTCCTGAT GCACAACCCG CGAGTCAGCG ATGCGGTACT CAGCGCCGAA 
GACGATGTGG CGCAGAGAGA TTCATAA

Protein sequence

MAAARGVCGV AAPGAQEVGV GARRAVLPES SAQNPLTVID DAVRLAGRTA IRLARGIPVV 
GNRFGAPPHL DLDGRVVFVT GAARGLGAQI ARQAHARGAQ VVLVGRTLKP LEDLAAELGD 
GAAAFEADVT DAPALRRAAE GAVAAFGGID VVVANAGIAP PSETVATIDP DEFEHTVEVD 
LLGQWRTVRA TLPAVIAARG HIAFVGSIYA FFNGVLAAPY AVSKAGVEQL SRALRVELAQ 
HGVTAGIAYL GFIDTDLTSD AFADEHAAAI RSAAPGFITR PMSAESAAAA VLSGVERRAA 
QVTAPAWVGP VLAARSLTTA VMDDVLMHNP RVSDAVLSAE DDVAQRDS