Gene Mpe_A1001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A1001
Symbol
ID	4787177
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	1063365
End bp	1064414
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	68%
IMG OID	640089563
Product	putative vanillate O-demethylase oxygenase subunit A
Protein accession	YP_001020198
Protein GI	124266194
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.8149
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAACCC AGATCCCCTA CCTGACCAAC GCCTGGTACG TGGCGGCACT GTCCACCGAG 
GTGGGAGCGC AGGCGCTGTT CCACCGCAAG ATCCTGGACA CCTCGATCCT GATCTACCGC 
AAGCAGGACG GCACGGCGGT GGCGCTGCAC GACCGCTGCC CGCACCGCTT CGCGCCGCTG 
CACCTGGGCA AGCGGATCGG CGACGAGGTG GCGTGCCTGT ACCACGCGCT GCAGTTCGAC 
TGCACGGGGC AGTGCACGAA GAACCCGCAC GGCAACGGGC AGATCCCGAA GGCGGCGAAG 
GTGCGCAGCT TCCCGCTGGA GGAGCGCTAC GGATTCCTGT GGATCTGGAT GGGCGAGGAC 
GCGCCGGACC TGGCACGGCT GCCGGACTTC GGCGAGCTCG ACAAGGGCCC CGACACCGGC 
GTCGCCTTCA CCTACATGCA CATGAAGGCG AACTACGAGC TGATCATCGA CAACGTGATG 
GACCTGAGCC ACATCGACCA TGTGCACGGC GAGATCATCA CCACGCGCGG GCAGCTGTCG 
CCGCTGGTGC CGCAGATGCG GGAGGGCGAG CAGGCCATCT CCGCCCGCTG GGAATGGCAG 
CAGACGCCGG CGATGCTGAT CTTCGCCAAC TTCCTGCCCG AGCCCGCGGC CGGCGCGCGC 
CACTTCTTCG ACATCACCTG GACGCCGCCC GCGAACATCC AGCTCTCGGT CGGCGCGACG 
CAGGACGGCG GCGCGCTCGA CCTGGCCGGC TGCATCGGCC AGTACGACCT GCACACCTGC 
ACGCCGGAGA CCGCGAACAC CACCCACTAC TGGTTCGCGA CACGGCGCAA CCACGTCGTC 
GAGGACGCCG ACTACAACGC CATGAAGATC CAGGCCATGC ATGCGGCCTT CGAGAACGAG 
GACGGGCCGA TCATCGAGGC CGTGCACGAC GAGATGGGCA CCACCGACTT CTTCAGCCTG 
AACCCGGTGC TGATGACCAA CGACGTGGCA CCGGTCAAGG TGCGGCGGCG CCTGCGGCAG 
CTGATCCAGG ACGACAGGCG CGGCGCCTGA

Protein sequence

METQIPYLTN AWYVAALSTE VGAQALFHRK ILDTSILIYR KQDGTAVALH DRCPHRFAPL 
HLGKRIGDEV ACLYHALQFD CTGQCTKNPH GNGQIPKAAK VRSFPLEERY GFLWIWMGED 
APDLARLPDF GELDKGPDTG VAFTYMHMKA NYELIIDNVM DLSHIDHVHG EIITTRGQLS 
PLVPQMREGE QAISARWEWQ QTPAMLIFAN FLPEPAAGAR HFFDITWTPP ANIQLSVGAT 
QDGGALDLAG CIGQYDLHTC TPETANTTHY WFATRRNHVV EDADYNAMKI QAMHAAFENE 
DGPIIEAVHD EMGTTDFFSL NPVLMTNDVA PVKVRRRLRQ LIQDDRRGA