Gene Pnap_1901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pnap_1901
Symbol
ID	4689053
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Polaromonas naphthalenivorans CJ2
Kingdom	Bacteria
Replicon accession	NC_008781
Strand	-
Start bp	2024260
End bp	2025444
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	63%
IMG OID	639834908
Product	4-hydroxybenzoate 3-monooxygenase
Protein accession	YP_982132
Protein GI	121604803
COG category	[C] Energy production and conversion [H] Coenzyme transport and metabolism
COG ID	[COG0654] 2-polyprenyl-6-methoxyphenol hydroxylase and related FAD-dependent oxidoreductases
TIGRFAM ID	[TIGR02360] 4-hydroxybenzoate 3-monooxygenase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.213246
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTACCC AGGTTGCCAT CATCGGTGCA GGCCCTTCAG GCCTGCTGCT CGGCCAGTTG 
CTGCACAAGG CCGGCATTGA CGCCATCATT CTCGAACGCC AGACCGGCGA CTACGTGCTC 
GGCCGCATCC GCGCCGGGAT TCTGGAGCAG GTCTGCATCG ACCTGATGGA CGAGGCCGGT 
GTCGGCGAAC GCATGCACAA GGAAGGGCTG GTCCACGGCG GCTTCGAGAT GCTTTACAAC 
GGCAAGCGCC ACCGCATTGA CATGAACAAG CTGACCGGCG GCAAGAACGT CATGGTCTAT 
GGCCAGACCG AGCTGACCCG TGACCTGATG GATGCCCGCG CCGCTGCCGG TCTGCCCACC 
GTCTATGAAG CCACCCACGT CGCCGTGCAT GACTTTGACA CCGCCAAGCC CCGTGTCACC 
TACGAAAAAG ACGGCCAGAA GTTTGAAATC GAGTGCGACT TCATCGCTGG CTGCGACGGC 
TTTCATGGCG TGTGCCGCGC CAGTGCGCCG CGCAGCGCGA TCACCGAGTT TGAAAAGGTC 
TATCCCTTCG GCTGGCTCGG CCTGCTGTCG GACACGCCGC CAGTGCATGA CGAGCTGATC 
TACGTCAACA GCCCGCGCGG CTTTGCCTTG TGCTCGCAGC GCAGCAAAAC GCGCAGCCGC 
TACTACCTCC AGGTGCCGCT GACCGACCGG ATCGAAGAGT GGACCGACGA GGCGTTCTGG 
CAGGAGCTGC GCCTGCGCCT GGACGACGAA GGCCGCGAGA AACTCATCAC CGGCCCGTCG 
ATTGAGAAAA GCATTGCCCC GCTGCGCAGC TTCATCACCG AGCCGCTGCG CTTTGGCCGC 
ATGTTCCTGG CGGGCGACGC GGGCCACATC GTGCCGCCCA CCGGCGCCAA GGGCCTGAAC 
CTGGCGGCCA CCGATGTGAA ATACCTGTCC AGCGCCATCA TCGAGTTCTA CCAGGACAAG 
ACCGAAGCGG GCATCGACAA CTACTCCGAG CGCTGCCTCA AGCGCATCTG GAAGGGCGAG 
CGCTTCTCAT GGTGGTTCAC GCAGCTGATG CATCGCTTCC CCGATGACGG CGCCATCGTC 
GCCAAGTTCC AGCAGGCCGA ACTGGACTAC CTGCTCAACT CCGAAGCGGG TTCGCGCAGC 
ATTGCCGAGA ACTATGTCGG CCTGCCGCTG AATTTCGGCG AATAG

Protein sequence

MRTQVAIIGA GPSGLLLGQL LHKAGIDAII LERQTGDYVL GRIRAGILEQ VCIDLMDEAG 
VGERMHKEGL VHGGFEMLYN GKRHRIDMNK LTGGKNVMVY GQTELTRDLM DARAAAGLPT 
VYEATHVAVH DFDTAKPRVT YEKDGQKFEI ECDFIAGCDG FHGVCRASAP RSAITEFEKV 
YPFGWLGLLS DTPPVHDELI YVNSPRGFAL CSQRSKTRSR YYLQVPLTDR IEEWTDEAFW 
QELRLRLDDE GREKLITGPS IEKSIAPLRS FITEPLRFGR MFLAGDAGHI VPPTGAKGLN 
LAATDVKYLS SAIIEFYQDK TEAGIDNYSE RCLKRIWKGE RFSWWFTQLM HRFPDDGAIV 
AKFQQAELDY LLNSEAGSRS IAENYVGLPL NFGE