Gene Mjls_5235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_5235
Symbol
ID	4880933
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	-
Start bp	5484932
End bp	5486287
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	68%
IMG OID	640142547
Product	carotenoid oxygenase
Protein accession	YP_001073490
Protein GI	126437799
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3670] Lignostilbene-alpha,beta-dioxygenase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.751022
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAGA CCGACCACGC GCACGACGCC GTCAGCGCCG ACAACCTGCC GTCGGGAGAC 
GAGTTCTTCC ACAGGGGCAA CTACGCGCCC GTCGCCGACG AACTCACCGC CTTCGACCTG 
CCCGTCGAGG GACAGATCCC GGCCGATCTG CAGGGGTGGT ACCTGCGCAA CGGTCCGAAC 
CCGCGGCAGC CGTCCGCGCA CTGGTTCACC GGCGACGGGA TGATCCACGG CGTGCGCATC 
GAGAACGGCC GCGCCGCCTG GTACCGCAAC CGGTGGGTGC GCACGGAGAG CTTCGAGCAG 
CACTTCCCGG TCTACAACTC CGACGGCAGC CGCAACCTGC ACTCCAGCGT CGCCAACACC 
CACGTCGTCA ACCACGCAGG CAAGACCCTG GCGCTCGTCG AATCGTCGCT GCCCTACGAG 
ATCACCAACG ACCTGCAGAC CGTGGGCGCC TACGACTTCG GGGGCAAGCT GGTCGACTCG 
ATGACGGCGC ACCCGAAGAT CTGTCCGACC ACCGGGGAAT TGCACTTCTT CGGCTACGGC 
AACCTCTTCG AGCCCTACGT GACCTATCAC CGGGCCGACG CCGACGGCGA ACTGACCGTC 
AACCGGCCGC TGGACGTCAA GGCGTTGACG ATGATGCACG ACTTCGCGAT GACCAGTGGG 
CACGTGGTCT TCATGGACCT GCCGATCGTC TTCGACATGG GCATCGCGCT CGAGGGCAAG 
GGTGACATGC CCTACCGCTG GGACGACGAC TACGGCGCCC GCCTCGGCGT ACTGCGCCGC 
GACGACCCCT TCGGCGAGGT GCGCTGGTTC GACATCGACC CGTGCTACGT CTTCCACGTC 
GCCAACGCCT ACGAGGACGG GAACACGCTG GTGCTGCAGG CCGTGCGCTA CCCCGAACTG 
TGGCGCGGCA CAGGCGGATT CGAGGCCGAG GGAGTGCTGT GGAGCTGGAC CCTCGACCTG 
GCGACGGGCA CGGTGCGCGA ACGCCAGCTC GACGACCGGG CCGTGGAGTT CCCCCGCATC 
GACGACCGGT TGGCGGGTCT GCCTGCCCGG TACGCGGTGT CGGTGGGCGA TCAGCGGTTG 
GTGCGCTACG ACCTGACGAG CGGCACGGCG GTCGAACACG CCTTCGGGAC CGCCGACGCG 
CCGGGCGGAC CCGGCGAGGC GGTGTTCGTG CCGGCCACCT CGGGCCCCGC CGACGAACAG 
AACGGGTGGT ATATGGCGTA CGTCTACGAC CCGCAGCGCG ACGGCAGCGA TCTGGTGATC 
CTCGACGCCG CCGATTTCGG CGCCCCGCCG GTGGCCAGGG TGCAACTGCC GCAACGGGTT 
CCGTACGGTT TCCACGGCAA CTGGATCGCT GGGTAG

Protein sequence

MTETDHAHDA VSADNLPSGD EFFHRGNYAP VADELTAFDL PVEGQIPADL QGWYLRNGPN 
PRQPSAHWFT GDGMIHGVRI ENGRAAWYRN RWVRTESFEQ HFPVYNSDGS RNLHSSVANT 
HVVNHAGKTL ALVESSLPYE ITNDLQTVGA YDFGGKLVDS MTAHPKICPT TGELHFFGYG 
NLFEPYVTYH RADADGELTV NRPLDVKALT MMHDFAMTSG HVVFMDLPIV FDMGIALEGK 
GDMPYRWDDD YGARLGVLRR DDPFGEVRWF DIDPCYVFHV ANAYEDGNTL VLQAVRYPEL 
WRGTGGFEAE GVLWSWTLDL ATGTVRERQL DDRAVEFPRI DDRLAGLPAR YAVSVGDQRL 
VRYDLTSGTA VEHAFGTADA PGGPGEAVFV PATSGPADEQ NGWYMAYVYD PQRDGSDLVI 
LDAADFGAPP VARVQLPQRV PYGFHGNWIA G