Gene Mpe_A0807 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A0807
Symbol
ID	4784491
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	845877
End bp	846872
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	73%
IMG OID	640089368
Product	vanillate O-demethylase oxygenase subunit
Protein accession	YP_001020004
Protein GI	124266000
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGACG AGCATCGCTG GTGGTATCCG GTCGCCACCG CTGCCGACCT GGGCGCCGGC 
CCGCTGCCGG CGGCGCTGTT CGGTGAGGAC CTGGTGCTGT GGCGCGACGA AGCCGGCACG 
CCGCACGCCT TCACGGATCG CTGCCCGCAC CGCGGCACGC GGCTCTCGCT CGGCGCGGTG 
CGCGTCGTCG ACGGCCGGGC GCAGCTCGAG TGTCCGTACC ACGGCTGGCG CTTCGACGGC 
GGCGGGCGCT GTCTGCGCAT CCCGGCGCTG CCCGACTTCA CGCCGGCGAC TGGCCATGCG 
GCGCGGGCCC ATCCGCTGCG CGAGGCGCAT GGCCTGCTGT GGGTCGTGCT CGGCGGTGAT 
GCCAACCTGG AGACCGTCGC CACGGCCTGC CTGCCCGACC CGGGGCCGGT ACCGGGCCGT 
GCCGTCGTCT GCGGTCACTA CGACGTGGGC ACATCGGCGC CGCGGGTGGT GGAGAACTTC 
CTCGACACCT CGCACTTCGC CTTCGTGCAT GAAGGCTGGC TCGGCGACCG CGACCACACC 
GAAGTGCCGA TCTACGACGT GGTGCCCGAC GCCAACGGCG CGCCTGGCGT GCCGCACTAC 
CGTGCGTGGC AGCCGCAGGC CAGCGCGCAG TCGGCCGGCG GCGCCTGGGT CGACTACCGC 
TACCAGGTGC TGTCTCCCTG CAGCGCCTTG CTGGTCAAGC AGGCCGGCGA CGACGCGCAG 
ACGACGCAGG AGGCCTATGC GTTATGGGTT GCGCCGCTGG AACCTGAGCG CAGCCGCGTG 
TGGTTCACGC TGTTCACCTG CGATACCGCC ACGCCCGACG AGACGCTGCG CGCCTTCCAG 
CACGGCATCT TCACGCAGGA CCAGCCGGTG CTCGAATCGC AGCGGCCGCG CCGGCTGCCG 
CTGAGCGGCA GCGAGGCGCA CTGCGCGGCC GATCGCCTGA GCACCGCCTA CCGGCGCTAC 
CTGCAGGCGC AGGGCCACAC CTACGGCACC TGCTGA

Protein sequence

MNDEHRWWYP VATAADLGAG PLPAALFGED LVLWRDEAGT PHAFTDRCPH RGTRLSLGAV 
RVVDGRAQLE CPYHGWRFDG GGRCLRIPAL PDFTPATGHA ARAHPLREAH GLLWVVLGGD 
ANLETVATAC LPDPGPVPGR AVVCGHYDVG TSAPRVVENF LDTSHFAFVH EGWLGDRDHT 
EVPIYDVVPD ANGAPGVPHY RAWQPQASAQ SAGGAWVDYR YQVLSPCSAL LVKQAGDDAQ 
TTQEAYALWV APLEPERSRV WFTLFTCDTA TPDETLRAFQ HGIFTQDQPV LESQRPRRLP 
LSGSEAHCAA DRLSTAYRRY LQAQGHTYGT C