Gene Mkms_4956 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_4956
Symbol
ID	4612633
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	5194883
End bp	5196238
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	68%
IMG OID	639794648
Product	carotenoid oxygenase
Protein accession	YP_940935
Protein GI	119870983
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3670] Lignostilbene-alpha,beta-dioxygenase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAGA CCGACCACGC GCGCGACGCC GTCAGCGCCG ACAACCTGCC GTCGGGAGGC 
GAGTTCTTCC ACAAGGGCAA CTACGCGCCC GTCGCCGACG AACTCACCGC CTTCGACCTG 
CCCGTCGAGG GGCAGATCCC GGCCGATCTG CAGGGGTGGT ACCTGCGCAA CGGTCCGAAC 
CCGCGGCAGC CGTCCGCGCA CTGGTTCACC GGCGACGGCA TGATCCACGG CGTGCGCATC 
GAGAACGGCC GCGCCGCCTG GTACCGCAAC CGGTGGGTGC GCACGGAGAG CTTCGAGCAG 
CACTTCCCGG TCTACAACTC CGACGGCAGC CGCAACCTGC ACTCCAGCGT CGCCAACACC 
CACGTCGTCA ACCACGCAGG CAAGACCCTG GCGCTCGTCG AATCGTCGCT GCCCTACGAG 
ATCACCAACG ACCTGCAGAC CGTGGGCGCC TACGACTTCG GGGGCAAGCT GGTCGACTCG 
ATGACGGCGC ACCCGAAGAT CTGTCCGACC ACCGGCGAGT TGCACTTCTT CGGCTACGGC 
AACCTCTTCG AGCCCTACGT GACCTATCAC CGGGCCGCCG CCGACGGCGA ACTGACCGTC 
AACCGGCCGT TGGACGTCAA GGCGCTGACG ATGATGCACG ACTTCGCGAT GACCAGCGGG 
CACGTGGTCT TCATGGACCT GCCGATCGTC TTCGACATGG GCATCGCGCT CGAGGGCAAG 
GGTGACATGC CCTACCGCTG GGACGACGAC TACGGCGCCC GCCTCGGCGT ACTGCGCCGC 
GACGATCCCT TCGGCGAGGT GCGCTGGTTC GACATCGACC CGTGCTACGT CTTCCACGTC 
GCCAACGCCT ACGAGGACGG GAACACGCTG GTGCTGCAGG CCGTGCGCTA CCCCGAACTG 
TGGCGCGGCA CAGGCGGATT CGAGGCCGAG GGAGTGCTGT GGAGCTGGAC CCTCGACCTG 
GTGACGGGCA CGGTGCGCGA ACGCCAGCTC GACGACCGGG CCGTGGAGTT CCCCCGCATC 
GACGACCGGT TGGCGGGTCT GGCGGCCCGG TACGCGGTGT CTGTGGGCGA TCAGCGGTTG 
GTGCGCTACG ACCTGACGAG CGGTACGGCG GTCGAACACG CCTTCGGGAC CGCCGACGCG 
CCGGGCGGAC CCGGCGAGGC GGTGTTCGTG CCGGCCACCT CGGGACCCGT CGACGAACAG 
AACGGGTGGT ATATGGCGTA CGTCTACGAC CCGCAGCGCG ACGGCAGCGA TCTGGTGATC 
CTCGACGCCG CCGACTTCGC CGGCCAGCCG GTCGCGAGAA TCAAATTGCC GCAACGGGTT 
CCGTACGGTT TCCACGGCAA TTGGATCACC GGATAG

Protein sequence

MTETDHARDA VSADNLPSGG EFFHKGNYAP VADELTAFDL PVEGQIPADL QGWYLRNGPN 
PRQPSAHWFT GDGMIHGVRI ENGRAAWYRN RWVRTESFEQ HFPVYNSDGS RNLHSSVANT 
HVVNHAGKTL ALVESSLPYE ITNDLQTVGA YDFGGKLVDS MTAHPKICPT TGELHFFGYG 
NLFEPYVTYH RAAADGELTV NRPLDVKALT MMHDFAMTSG HVVFMDLPIV FDMGIALEGK 
GDMPYRWDDD YGARLGVLRR DDPFGEVRWF DIDPCYVFHV ANAYEDGNTL VLQAVRYPEL 
WRGTGGFEAE GVLWSWTLDL VTGTVRERQL DDRAVEFPRI DDRLAGLAAR YAVSVGDQRL 
VRYDLTSGTA VEHAFGTADA PGGPGEAVFV PATSGPVDEQ NGWYMAYVYD PQRDGSDLVI 
LDAADFAGQP VARIKLPQRV PYGFHGNWIT G