Gene Mkms_2707 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_2707
Symbol
ID	4615993
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	2830531
End bp	2831601
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	67%
IMG OID	639792373
Product	aldo/keto reductase
Protein accession	YP_938692
Protein GI	119868740
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0109998
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGGAG ACCTGTTGAT CGGTGACGCG CCCTTCTCCC ACGACCCCTG GGTGGCCAGG 
CGGGAACGCT ACGATTCGAT GCCGTACCGG CGGGTGGGTG ACTCCGGGCT GCTGCTGCCC 
GCGATCTCGC TGGGCCTCTG GTACAACTTC GGCGACAACC GGCCGTTCGA CGTGCAACGC 
GAGGTGCTGC GGTACGCCTT CGACCGCGGC ATCACGCATT TCGATCTCGC CAACAACTAC 
GGCCCGCCGT ACGGTTCGGC CGAGGAGAAC TTCGGCCGGA TGCTGCGCCG GGACTTCAAG 
CCGTATCGCA ACGAGTTGAT CGTCTCGACC AAGGCCGGCT GGGACATGTG GCCCGGACCG 
TACGGGCAGC TCGGCGGCCG GGCCTACCTG CTCGCCAGCC TCGACGAATC ACTCGACCGT 
CTCGGCCTCG ACTACGTCGA CATCTTCTAC TCGCACCGCA TCGATCCGAC GACACCGCTC 
GAGGAGACCG TCGGCGCACT CGACACCGCG GTGCGAGCCG GTAAGACCCG CTACGTCGGG 
GTCTCGTCGT ATTCGGCGGC CAAGACCGCC GAAGCGGCCG CGATCGCGAG ACGTCTCGGC 
ACTCCGTTGG TGATCCACCA GCCGTCGTAC TCACTGCTGA ACCGGTGGAT CGAGGGCGAC 
CTCACCACCG AACTCCGCAA CGCCGGCATG GGTGCGATCG CGTTCACCGC ACTGGCCCAG 
GGTCTGCTGA CCGACCGCTA CCTGCAGTCC GACCCGAGCG AGATCGACCG TGCCACAGCA 
CGACCCACGT TCAACGACGA GCACATCACC GACCGGGTGC GCGAGCAGCT GCGGGGTCTG 
GCCGGCATCG CCGAACGTCG TGGACAGTCG CTGGCCCAAC TCGCGCTGGC GTGGGTGCTC 
CGTGACCCGA CCGTCGCATC CACACTCGTC GGCGCGTCGA GCGTCGCGCA GCTCGAAGAG 
AACCTCGGCG CCCTCGACAA CCTCGACTTC ACCGCCGACG AGCTCGCCGA AATCGACCGG 
TACGCAACCG AATCCGGAAT CGACCTGTGG CGAGAGAGCT CCGATGTCTA G

Protein sequence

MSGDLLIGDA PFSHDPWVAR RERYDSMPYR RVGDSGLLLP AISLGLWYNF GDNRPFDVQR 
EVLRYAFDRG ITHFDLANNY GPPYGSAEEN FGRMLRRDFK PYRNELIVST KAGWDMWPGP 
YGQLGGRAYL LASLDESLDR LGLDYVDIFY SHRIDPTTPL EETVGALDTA VRAGKTRYVG 
VSSYSAAKTA EAAAIARRLG TPLVIHQPSY SLLNRWIEGD LTTELRNAGM GAIAFTALAQ 
GLLTDRYLQS DPSEIDRATA RPTFNDEHIT DRVREQLRGL AGIAERRGQS LAQLALAWVL 
RDPTVASTLV GASSVAQLEE NLGALDNLDF TADELAEIDR YATESGIDLW RESSDV