Gene Mpe_B0555 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_B0555
Symbol
ID	4787398
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008826
Strand	-
Start bp	502407
End bp	503819
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	67%
IMG OID	640092982
Product	phthalate 4,5-dioxygenase
Protein accession	YP_001023560
Protein GI	124263090
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.547165
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.18525
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTAACA GAGAGCCTTT GGCCGCGGCC GGGCAGGGCA CAGCCTACAG CGGGTACCGG 
CTGCGCGACC TGCAGAATGC CGCCCCCACG AACCTGGAAA TCCTTCGTAC GGGCCCCGGC 
ACGCCGATGG GCGAGTACAT GCGCCGCTAC TGGCAGCCCG TATGCCTGTC GCAGGAACTG 
ACCGACGTGC CCAAGGCGAT CCGGATCCTG CACGAGGATC TGGTGGCATT CAGGGACCGC 
CAGGGCAACG TCGGCGTGCT GCACCGCAAG TGCGCCCACC GCGGGGCCTC GCTCGAGTTC 
GGCATCGTGC AGGAACGCGG GATCCGCTGC TGCTACCACG GTTGGCACTT CGACGTCGAC 
GGCAAACTGC TGGAGGCGCC GGCGGAACCC CCCGACACCA AGCTGAAGGA AACCGTCTGC 
CAGGGCGCCT ATCCGGCCTT CGAGCGCGAC GGCCTGGTGT TCGCCTACAT GGGGCCGGCG 
GATCGCAGAC CGGAGTTCCC GGTGTTCGAC GGCTACGTGT TGCCGAAGGG AACGCGGTTG 
ATTCCGTTCT CCAATGTCTT CGACTGCAAC TGGCTTCAGG TCTACGAAAA CCAGATCGAC 
CACTACCACA CCGCGCTGCT GCACAACAAC ATGACGGTCG CCGGCGTGGA CTCGAAGCTG 
GCCGACGGCG CGACGCTGCA GGGGGGCTTC GGCGAGATGC CAATCATCGA CTGGCACCCG 
ACCGACGACA ACAACGGCAT GATCTTCACC GCCGGCCGGC GCCTGTCGGA CGACGAAGTC 
TGGATCCGAA TCTCGCAGAT GGGCCTGCCG AACTGGATGC AGAACGCCGC CATCGTGGCG 
GCGGCGCCGC AGCGACACTC CGGCCCGGCG ATGTCGCGTT GGCAGGTGCC GGTCGACGAC 
GAGCACTCGA TCGCCTTCGG CTGGCGCCAC TTCAACGACG AGGTGGACCC GGAGCACCGT 
GGAAGGGAAG AGGAGTGCGG GGTCGACAAG ATCGACTTTC TGATCGGTCA GACCCGGCAT 
CGGCCTTATG AAGAGAGGCA GCGGGTTCCG GGCGACTACG AAGCCATCGT CAGCCAGGGG 
CCGATAGCCG TCCACGGCCT TGAGCATCCC GGCCGGTCGG ACGTGGGTGT GTACATGTGT 
CGCTCGCTGC TTCGCGACGC TGTGGCCGGC AAGGCGCCGC CCGACCCGGT GCGCGTGAAG 
GCTGGGTCGA CCGATGGGCA AACGCTGCCG CGATACGCGT CGGACAGTCG ACTGCGGATC 
CGCCGCCGGC CGAGCCGGGA AGCGGACAGT GACGTCATCC GCAAGGCCGC GCACCAGGTT 
TTCGCGATCA TGAAGGAGTG CGACGAACTG CCGGTCGTGC AGCGCAGGCC GCATGTCCTG 
CGGCGCCTCG ACGAGATCGA AGCGAGCCTC TGA

Protein sequence

MGNREPLAAA GQGTAYSGYR LRDLQNAAPT NLEILRTGPG TPMGEYMRRY WQPVCLSQEL 
TDVPKAIRIL HEDLVAFRDR QGNVGVLHRK CAHRGASLEF GIVQERGIRC CYHGWHFDVD 
GKLLEAPAEP PDTKLKETVC QGAYPAFERD GLVFAYMGPA DRRPEFPVFD GYVLPKGTRL 
IPFSNVFDCN WLQVYENQID HYHTALLHNN MTVAGVDSKL ADGATLQGGF GEMPIIDWHP 
TDDNNGMIFT AGRRLSDDEV WIRISQMGLP NWMQNAAIVA AAPQRHSGPA MSRWQVPVDD 
EHSIAFGWRH FNDEVDPEHR GREEECGVDK IDFLIGQTRH RPYEERQRVP GDYEAIVSQG 
PIAVHGLEHP GRSDVGVYMC RSLLRDAVAG KAPPDPVRVK AGSTDGQTLP RYASDSRLRI 
RRRPSREADS DVIRKAAHQV FAIMKECDEL PVVQRRPHVL RRLDEIEASL