Gene Mkms_4151 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_4151
Symbol
ID	4612091
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	4379531
End bp	4380559
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	70%
IMG OID	639793835
Product	aldo/keto reductase
Protein accession	YP_940133
Protein GI	119870181
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGTATC GGCGGGTTGG CGAATCGGGT CTGACGGTGT CGGAGATCAG TTTCGGCGCA 
GCGACATTCG GCGGGGTCGG CGACTTCTTC GGCGCCTGGG GCGATACCGG CGTCGAGGGC 
GCGCGTCGCA TCGTGGACAT CTGCCTGGAG GCTGGTGTCA CGCTGTTCGA CACCGCGGAC 
GTGTACTCCG ACGGCGCCTC GGAGGAGGTG CTCGGCGAAG CCCTGCGCGG CCGGCGCGAC 
CGGGTGCTCA TCTCCACCAA GGCCGCGCTG CCCACCTCGA CCGGCTGGGG CACCTCACGC 
GCTCGGTTGC TGCGTGCGGT CGAGGATGCG CTGCGGCGGT TGCGGACCGA CCGCATCGAC 
CTGTTCCAAC TGCACGGCTA CGACTCGGGG ACGCCGATCG AGGAAGTCGT GGCGACCCTC 
GACACGCTGC TCACGCAGGG CAAGGTGCGC TACACCGGCG TGTCGAACTT CTCCGGATGG 
CAGTTGATGA AATCGCTGGC GGTCGCCGAC GGCGCACACC GCACCCGCCA CATCGCCCAT 
CAGGTCTACT ACTCGCTCGT CGGGCGGGAT TACGAATGGG AACTCATGCC GCTGGGCCTT 
GCCGAGGGCG TCGGCGCGCT GGTGTGGAGT CCGCTGGGCT GGGGACGGCT CACCGGCCGG 
ATCCGGCGCG GACGACCGCT GCCCGAGCGC AGCCGCCTGC ACGCGACCGC TGACGCGGGT 
CCGCCCGTCG ACGAGGATCG GCTCTACGCC GTCGTCGACA CCCTCGACGA CATCGCCGCG 
GAGACCGGAC GCACCGTGGC GCAGATCGCG CTCAACTGGC TCCTGCGGCG GCCGACCGTC 
GCCTCGGTGA TCATCGGAGC CCGCAACGAG GAACAGCTGC GCGAGAACCT GGGCGCCGTC 
GGCTGGCGAC TCGACGACGA GCAGATCGCC CGGCTGGACG CGGTCAGCGC CCGGGAGGCG 
CCGTATCCCT ACTTCCCGTA CCGCAGGCAG GAAGGTTTCG CACTGCTCGA TCCGCCGGTG 
GCGGGTTAG

Protein sequence

MEYRRVGESG LTVSEISFGA ATFGGVGDFF GAWGDTGVEG ARRIVDICLE AGVTLFDTAD 
VYSDGASEEV LGEALRGRRD RVLISTKAAL PTSTGWGTSR ARLLRAVEDA LRRLRTDRID 
LFQLHGYDSG TPIEEVVATL DTLLTQGKVR YTGVSNFSGW QLMKSLAVAD GAHRTRHIAH 
QVYYSLVGRD YEWELMPLGL AEGVGALVWS PLGWGRLTGR IRRGRPLPER SRLHATADAG 
PPVDEDRLYA VVDTLDDIAA ETGRTVAQIA LNWLLRRPTV ASVIIGARNE EQLRENLGAV 
GWRLDDEQIA RLDAVSAREA PYPYFPYRRQ EGFALLDPPV AG