Gene Mpe_A0963 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A0963
Symbol
ID	4787109
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	1022615
End bp	1023667
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	69%
IMG OID	640089525
Product	vanillate O-demethylase oxygenase subunit
Protein accession	YP_001020160
Protein GI	124266156
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTGTGA AGAACGCGTG GTACTGCGCG GGGTGGGACA AGGACCTGAG CCTGGGCCGT 
GACGGCCTGC TGGCGCGGCG CATCGCCGGC GAGTCGCTGG TGCTCTACCG TCGACCCGAT 
GCCGCGGTGG TGGCGATGGA GGACCGCTGC TGCCACCGGC ACGCACCGCT GTCGCTGGGG 
CGCAAGGAGG GCGACTCGAT CCGCTGCATG TACCACGGCA TGAAGTTCGG GCCCGACGGC 
CGCTGCACCG AGATCCCGGG CATGAGCCGG ATCCCCGAGA AGGCCTGCGT GCGCACCTAC 
CCGGTCGTCG AGCGCGACAA CTGGATCTGG GTCTGGATGG GCGAGCCCGC GAAGGCCGAC 
CCGGCGTTGA TCTGCGAGGC CATCGGTCCT GGCGACCCGG CCTGGAACCT GCGGCTCGGC 
TATGTGCGCG TCGACACCAA CTACCGGCAG GAGATCGCGA ACCTGGCCGA CCTGAGCCAC 
GTGGCCTGGG TGCACAGCCA GACGCTGGGC GGATCGGATG CCTGGTCGAA CATCAAGCCG 
CGCCATGAGC TGACCGAGCG CGGCATCGAC ACCCGCTACT GCGTGCGCCG CACGCCGCCC 
CCCAGTTTCG CCAGGCACCT GTTCCCGGAG GGCGCGCTGT TCGACATCCA GGTCCATGTG 
CGCATGAGCG TGCCATGCAA CTTCATCCTG CATTTCTCGG TGCACGAGGT GGGCAGCGCG 
ACCGAGGGGC CGACCAACGG ACGCCTGGTG CTCGACACCT TCTCCAGCCA GGCCGTGACG 
CCGCGCGACG CGCACTCCTG CGACTACTAC TACTCCTGGG GCTGCAGCCG CGCCACCGAC 
ATGCCGGGCC TCACCGACCT GATGCACGAG GCCAACAACG ACGCCTTCCT CGAGGACAAG 
GCGATGCTCG AAGGGCAGTA CCAGCGGATG CGCGAGCGCC CCGACGCGCC CAGCGTGGAC 
ATCGTCCACG ACGCGGGGCC CGGCAAGTTG CTGTGGGTGC TGGACCGCCT GCTGAAGGCG 
GAGGCGCGCG CGATCGAGAT CGTTCCGGCC TGA

Protein sequence

MFVKNAWYCA GWDKDLSLGR DGLLARRIAG ESLVLYRRPD AAVVAMEDRC CHRHAPLSLG 
RKEGDSIRCM YHGMKFGPDG RCTEIPGMSR IPEKACVRTY PVVERDNWIW VWMGEPAKAD 
PALICEAIGP GDPAWNLRLG YVRVDTNYRQ EIANLADLSH VAWVHSQTLG GSDAWSNIKP 
RHELTERGID TRYCVRRTPP PSFARHLFPE GALFDIQVHV RMSVPCNFIL HFSVHEVGSA 
TEGPTNGRLV LDTFSSQAVT PRDAHSCDYY YSWGCSRATD MPGLTDLMHE ANNDAFLEDK 
AMLEGQYQRM RERPDAPSVD IVHDAGPGKL LWVLDRLLKA EARAIEIVPA