Gene Mmcs_3098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_3098
Symbol
ID	4111930
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	3276215
End bp	3277705
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	67%
IMG OID	638032228
Product	carotenoid oxygenase
Protein accession	YP_640261
Protein GI	108800064
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3670] Lignostilbene-alpha,beta-dioxygenase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGAGTGG AACGCCTGCA GACCTTCGCC TCGACGCTGC CCGCCGATGA CGACCATCCG 
TACCGCACCG GGCCGTGGCG CCCCCAGGTC ACCGAGTGGC GGGCCGACGA CCTCGAGGTC 
GTCGCCGGCG AGGTGCCTGC CGATCTCGAC GGCATGTACC TGCGCAACAC GGAGAACCCG 
CTGCATCCGG CCGCGACGGC CTACCACCCG TTCGACGGTG ACGGGATGAT CCACATCGTC 
GAGTTCGGCG GGGGAAAAGC GGCCTACCGC AACCGCTTCG TCCGCACCGA CGGCTTCCTC 
GCCGAGAACG AGGCCGGGGG ACCGCTGTGG GCCGGGTTCA TCGAGATGCC CTCGGCCGCC 
AAACGCGCCG ACGGCTGGGG CGCGCGCACG CGGATGAAGG ACGCGTCGAG CACTGACGTC 
GTCGTCCACC GCGGGACGGC GCTGACCAGT TTCTACATGT GCGGCGACCT CTACCAGGTC 
GACCCGTACA CCGCCGACAC CCTCGGCAAG GAGACCTGGC ACGGCGACTT CCCGGACTGG 
GGGGTGTCGG CGCATCCCAA GATCGACCCG GTCACCGGGG AGCTGCTGTT CTTCAGCTAC 
AGCAAGGAAG CGCCTCATCT GCGCTACGGC GTGGTCGACA AGGACGCGAA CCTGGTGCAC 
CACACCGACG TCGCGCTGCC CGGGCCGCGG ATGCCGCACG ATATGGCGTT CACCGAGAAC 
TACGTGATCC TCAACGACTT CCCGCTGTTC TGGGAGCCGT CGCTGCTGAA GCAGGACATC 
CACGCACCGG TCTTCCACCG CGACATGCCG TCGCGTTTCG CCGTGCTGCC CCGCCGCGGT 
GACCAGTCGC AGGTGCGGTG GTTCGAGACC GACCCGACGT ATGCCCTGCA CTTCGTCAAC 
GCCTACGAGG ACGGTGACGA GATCGTGCTC GACGGGTTCT TCCAGGACAA CCCGTCACCG 
TCGACGAAGG GCGCGAAGTC GTTGGAGGAC GCGGCCTTCC GCTACCTGGC ACTCGACGGG 
TTCGAATCGC ACCTGCACCG CTGGCGGTTC AACCTCGCCA CGGGGGCGGC CACGGAGGAA 
CGGCTGTCGG ACAGCCTCAC CGAATTCGGC ATGATGAACG GTGACTACCA GACCCGGCGG 
CACCGCTACG TGTACGCCGC CACCGGCAAA CCGGGCTGGT TCCTGTTCGA CGGGCTGGTC 
AAACACGATC TGCGCGACGG TACCGAGGAG CGGATCACGT TCGGCGACGG CGTGTTCGGC 
AGCGAGACCG CGATGGCGCC GCGTCAGGAC GGCACCGCCG AGGACGACGG CTACCTCGTC 
ACCCTGACCA CGGACATGAA CGACGACGCC TCCTACTGCT TGGTGTTCGA TGCCGCGCGG 
ATCGCCGACG GTCCGGTGTG CAAGCTGCGG CTTCCTGAAA GAATCTGCAG CGGAACACAT 
TCGACGTGGG TGTCCGGGGC TGAGCTGCGG CGCTGGCACA GCCCGCGGTG A

Protein sequence

MRVERLQTFA STLPADDDHP YRTGPWRPQV TEWRADDLEV VAGEVPADLD GMYLRNTENP 
LHPAATAYHP FDGDGMIHIV EFGGGKAAYR NRFVRTDGFL AENEAGGPLW AGFIEMPSAA 
KRADGWGART RMKDASSTDV VVHRGTALTS FYMCGDLYQV DPYTADTLGK ETWHGDFPDW 
GVSAHPKIDP VTGELLFFSY SKEAPHLRYG VVDKDANLVH HTDVALPGPR MPHDMAFTEN 
YVILNDFPLF WEPSLLKQDI HAPVFHRDMP SRFAVLPRRG DQSQVRWFET DPTYALHFVN 
AYEDGDEIVL DGFFQDNPSP STKGAKSLED AAFRYLALDG FESHLHRWRF NLATGAATEE 
RLSDSLTEFG MMNGDYQTRR HRYVYAATGK PGWFLFDGLV KHDLRDGTEE RITFGDGVFG 
SETAMAPRQD GTAEDDGYLV TLTTDMNDDA SYCLVFDAAR IADGPVCKLR LPERICSGTH 
STWVSGAELR RWHSPR