Gene Mkms_1668 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_1668
Symbol
ID	4613956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	1783726
End bp	1785093
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	63%
IMG OID	639791335
Product	ring hydroxylating dioxygenase, alpha subunit
Protein accession	YP_937661
Protein GI	119867709
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.779225
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACCG AAACAACCGG AACAGCTGAC GCGACCGATC CCTACCTGCG GCGCGCGTTG 
CGGGAGGTAG CGGACGGGCT CAAGGTCGGG CGCTTACCGG CCCGCGTCGT CAGCGATCCC 
GCGCTACACA CGATCGAGAT GGAGCGGATC TTCGGGCGCG CCTGGGTGTT TCTCGGACAC 
GAGTCGGAGT TGGCCAAGTC CGGCGACTTC GTCGTGCGGC ACATCGGGGC CGATTCGGTG 
ATCGTTTGCC GGGACAACTC CGGCCGCATC CAGGCGCTGT CCAATTCTTG TCGCCACCGT 
GGTGCGCTCG TGTGCCGGGC GGAGATGGGA AACACCGCGC ACTTCCAATG CCTGTACCAC 
GGCTGGGTGT ACAGCAACAC CGGAGAGCTC GTCGGCGTGC CGGCGATGAC GGAGGCCTAT 
CCCGGCGGCT TCGACAAGTC GCAGTGGGGA TTACGTCACA TCCCCCATGT CGACTCGTAC 
GCCGGATTCA TCTTCGGCAG CGTCGATCCG AAGGCGCCGA GCCTGACCGA CTACCTCGGC 
GACACGACGT TCTACCTCGA CCTCATTGCG AAGAAGACAG CGGGCGGTCT GGAGGTGATA 
GGGGCACCGC ATCGATGGGT GATGTCAGCG AACTGGAAGA CAGCCGCCGA CAATTTTGTC 
GGCGACTCCT ACCACACCCT CTTTGCTCAC CGCTCGATGG TCGAGCTAGG CATGGCGCCC 
GGTGACCCAA ACTTCGCGAG CGCACCAGCG GAAATCTCGC TGCAGAACGG CCACGGCGTC 
GGCGTACTCG GCTTTCCGCC CACGCTCGCC GATTTTCCCG AGTACGAGGG ATACCCCGAC 
GAAGTCGTCG ACCAGATGGC GACGTCCTAC CCGTCGCCGG TACACAAGGA CCTGATGCGA 
CGCTCATCCT TTATTCACGG CACCGTGTTC CCGAATTTGT CGTTCATCAA CGTGACCCTC 
GCGCAGGACC ACATGTCGCC CCCTACCCCC TTCATCACGT TCCGGGTATG GCATCCGCTC 
TCCCATGATC GGATGGAGAT CCTCTCCTGG TTCCTGGTCG AACGCGATGC TCCGGAATGG 
TTGCGCGATG CGTCCCAGGC GTCCTACGTC AACAACTTCG GCCCAGGTGG GGTTTTCGAA 
CAGGACGACG CCGAGGCATG GAAGGCCATC ACCGAATCTG TCCAGGGCCC GTTCGCCGGT 
GAAGGCCTGC TGAACTACGA AATGGGCATG GACTTGACTC CGCTCACCGA CTGGCCAGGG 
CCGGGAGAGG CCCTCCCGAG CGGGTACGCC GAGCAGAATC AGCGGCGGTT TTGGGGGAGA 
TGGCTGGAAT ACATGGGTCA GCCTCCCGCA TTCGGCGGGC GTGCTTGA

Protein sequence

MTTETTGTAD ATDPYLRRAL REVADGLKVG RLPARVVSDP ALHTIEMERI FGRAWVFLGH 
ESELAKSGDF VVRHIGADSV IVCRDNSGRI QALSNSCRHR GALVCRAEMG NTAHFQCLYH 
GWVYSNTGEL VGVPAMTEAY PGGFDKSQWG LRHIPHVDSY AGFIFGSVDP KAPSLTDYLG 
DTTFYLDLIA KKTAGGLEVI GAPHRWVMSA NWKTAADNFV GDSYHTLFAH RSMVELGMAP 
GDPNFASAPA EISLQNGHGV GVLGFPPTLA DFPEYEGYPD EVVDQMATSY PSPVHKDLMR 
RSSFIHGTVF PNLSFINVTL AQDHMSPPTP FITFRVWHPL SHDRMEILSW FLVERDAPEW 
LRDASQASYV NNFGPGGVFE QDDAEAWKAI TESVQGPFAG EGLLNYEMGM DLTPLTDWPG 
PGEALPSGYA EQNQRRFWGR WLEYMGQPPA FGGRA