Gene RPD_1884 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1884
Symbol
ID	4022366
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	2112887
End bp	2114059
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	64%
IMG OID	637962077
Product	4-hydroxybenzoate 3-monooxygenase
Protein accession	YP_569020
Protein GI	91976361
COG category	[C] Energy production and conversion [H] Coenzyme transport and metabolism
COG ID	[COG0654] 2-polyprenyl-6-methoxyphenol hydroxylase and related FAD-dependent oxidoreductases
TIGRFAM ID	[TIGR02360] 4-hydroxybenzoate 3-monooxygenase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.316632
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.150769
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCACGC AAGTCGGCAT CATCGGCGCC GGGCCGTCGG GTCTGCTGCT CGGCCAGTTG 
CTGCACACAT ACGGGATCGA GGCCGTCATT CTCGAGCGCA AGAACCCCGA CTACGTGCTT 
TCACGCATCC GCGCCGGCGT ACTTGAACAG GGGATGGTCG ATCTGCTCGA CGAGGCCGGG 
GTCGGCCGGC GCCTGCATCA GGAAGCGTTG GTGCACGATG GCTTCGAGAT CGCGTTTTCC 
GGCCGGCGAC ACCGCATCGA CCTCAAGCAC TCGACCGGCG GCAGAACCGT CACCGTGTAC 
GGCCAGACCG AGGTGACGCG CGATCTGATG GAGGCCCGGA AAGCCGCCGG CCTGACTACG 
ATTTACGAAG CGGCCGATAT CACCCTTCAC GATTTCGACG GCGAACGCCC CAGGGTGCGT 
TACTTCAAGG ACGGCGTCAG TCAGGAGCTC GCCTGCGATT TCATCGCCGG CTGCGACGGC 
TTCCACGGAG TCGCGCGGCA GAGCGCGCCG GCCAACGCGT TACAGACCTA CGAGCGGGTC 
TATCCGTTCG GCTGGCTCGG GGTGTTGTCC GACACGCCGC CGGTGTCGTC GGAACTGATC 
TACGTCAACC ACGACCGCGG GTTTGCGCTG TGCTCGATGC GCTCGGCACA TCGCAGCCGC 
TATTACGTGC AGTGTCCGCT GTCCGACGAT GTCGGTGAAT GGAGCGACGA TCGGTTCTGG 
GACGAACTGA AACAAAGGCT CGGCCCGGAA ACCGCCGGCC ATCTCGTCAC CGGCGCGTCG 
ATCGAGAAGA GCATCGCTCC ACTGCGTTCC TTCGTTGCCG AGCCGATGCG GTTCGGCCGG 
CTGTTCCTCG CCGGCGACGC CGCCCACATC GTGCCGCCGA CCGGTGCCAA GGGCCTCAAC 
CTCGCAGCCA GCGACGTGTA CTATCTTTCG CGCGCGCTGC GCGAGTTCTA TGATGAGGGA 
TCGAAAGGTG GGATCGATGC TTATTCCGCC AACGCGCTTC GCCGGGTGTG GAAGGCCGAA 
CGATTCTCGT GGTGGATGAC GTCGATTCTT CATCGCTTCC CCGACAGCGA CGCCTTCACC 
CAACGCATCC AGACCGCCGA ACTCGACTAT CTGGTCAGTT CGCAAGCCGC GACGACCTCG 
CTCGCGGAAA ACTACGTCGG GCTGCCTTAC TAA

Protein sequence

MRTQVGIIGA GPSGLLLGQL LHTYGIEAVI LERKNPDYVL SRIRAGVLEQ GMVDLLDEAG 
VGRRLHQEAL VHDGFEIAFS GRRHRIDLKH STGGRTVTVY GQTEVTRDLM EARKAAGLTT 
IYEAADITLH DFDGERPRVR YFKDGVSQEL ACDFIAGCDG FHGVARQSAP ANALQTYERV 
YPFGWLGVLS DTPPVSSELI YVNHDRGFAL CSMRSAHRSR YYVQCPLSDD VGEWSDDRFW 
DELKQRLGPE TAGHLVTGAS IEKSIAPLRS FVAEPMRFGR LFLAGDAAHI VPPTGAKGLN 
LAASDVYYLS RALREFYDEG SKGGIDAYSA NALRRVWKAE RFSWWMTSIL HRFPDSDAFT 
QRIQTAELDY LVSSQAATTS LAENYVGLPY