Gene Mvan_0203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_0203
Symbol
ID	4647716
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	213297
End bp	214691
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	69%
IMG OID	639803713
Product	carotenoid oxygenase
Protein accession	YP_951059
Protein GI	120401230
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3670] Lignostilbene-alpha,beta-dioxygenase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.297924
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTCCCG ACGATCTGAG CAGCCTCGGC GTCAGCGAGC CGCAACCCGC CGAACACGAC 
TACCGCGTCG AACAGATCGA CGGGACGATC CCGGCCGGGT TGCGCGGGAC GCTCTACCGC 
AACGGCCCCG GTCGCTGGGA GGACCACAAG GGGCGGCCGC TGCGTCATCT GTTCGACGGG 
GACGGCATGC TCTCGGCCTT CACCATCGAC GCCGCCGGCG TGCACTACCG CAACCGCTAT 
GTGCGTACCC GGCATTTCGG GGGCAGGGGC GGTGTCAGCC ACATGGGTAC CTCGGCGCCG 
GGGGGTTGGC GGGCGAACAT CTGCCGGGTG CCACCGAATC TCGCCAACAC CAACGTCGTC 
GAGCACGCCG GCCGCCTCTA CGCGTTGTGG GAGGGTGGCC CGCCGCACGA GATCGACCCG 
GATACCCTCG AGACCATGGG TGTACGTCGG TTCGGCGGCG AATTACGCTG GCTGGGAAGC 
TATTCCGCCC ATCCGAGCTT CTGCCCGAGC AGCGGGGCGA TGTTCAACTT CGGGGTCGAG 
CTGATGCCGC GTCCGCACCT GCGCATCTAC CGCACCGACC GGACGGGGCG CCTGCGGCAC 
TTCCGCTCGG CCGCGCTGCC GTACGCCGCG ATGGTCCACG ACTTCGCGAT CACCGAACGG 
TACATCGTGT TCCTCATCTC ACCGATCATC CCCGACGCGA TGTCGGTGGC GTTGGGGCGC 
GCGCCGATCG GTGACACGCT GCGCTACCGC CCCGAGCGGG GCAGTGTGGT TCTCCTGGTG 
CCGCGTGCCG GCGGAAAGAT CCGCCGTATC GAGTGCGAGG CGGTTCTGCA GTTCCATCTG 
AGCAACGCCT TCGATGACGG AGACGACGTG GTCATCGACG CCATCACCTA CGCCGACGGG 
CGGCTGCTCG AACGCATCGC GCGCTTCCAC ACCACCTCGC TGGCCGACAT GCCCTCGCAG 
TTCACGCGTT TTCGGGTCGG CGCAACGGGC AGGGTCGGGG CGGAGCCGCT GACCGACAGC 
CCGAGTGAGT TCCCCCGCCA TCACCCTGCG CGGGAGGGCC GACCGCACCG CTACGCGTAC 
GTCAACACGC GCCGGACGCT CGGCACGCTG TACGACACGG TCACCAAGCT CGACCTGGCC 
GATCAGACGG AGCTCAGCTA TCCCGCCCCC GAACCCGGCA ACAGCTTCTG CGAGCCGGTG 
TTCGCACCGC GGCCCGGCGC CACGGCCGAG GACGACGGCT GGTTGCTGAC CGTGGAGTAC 
CGGGCCGCGC ACAAGACGTC GCGGCTGGTC ATCCTGGATG CCGCGGACCC GTCGCGCGGA 
CCGGTCGCCA CGGCTCAACT TGCGAGTCAC ATCCCGCAGG GTTTCCACGG CAACTTCTCC 
GCGCGCACCA GCTGA

Protein sequence

MGPDDLSSLG VSEPQPAEHD YRVEQIDGTI PAGLRGTLYR NGPGRWEDHK GRPLRHLFDG 
DGMLSAFTID AAGVHYRNRY VRTRHFGGRG GVSHMGTSAP GGWRANICRV PPNLANTNVV 
EHAGRLYALW EGGPPHEIDP DTLETMGVRR FGGELRWLGS YSAHPSFCPS SGAMFNFGVE 
LMPRPHLRIY RTDRTGRLRH FRSAALPYAA MVHDFAITER YIVFLISPII PDAMSVALGR 
APIGDTLRYR PERGSVVLLV PRAGGKIRRI ECEAVLQFHL SNAFDDGDDV VIDAITYADG 
RLLERIARFH TTSLADMPSQ FTRFRVGATG RVGAEPLTDS PSEFPRHHPA REGRPHRYAY 
VNTRRTLGTL YDTVTKLDLA DQTELSYPAP EPGNSFCEPV FAPRPGATAE DDGWLLTVEY 
RAAHKTSRLV ILDAADPSRG PVATAQLASH IPQGFHGNFS ARTS