Gene RPD_3292 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3292
Symbol
ID	4023801
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	3644111
End bp	3645325
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	71%
IMG OID	637963495
Product	salicylate 1-monooxygenase
Protein accession	YP_570417
Protein GI	91977758
COG category	[C] Energy production and conversion [H] Coenzyme transport and metabolism
COG ID	[COG0654] 2-polyprenyl-6-methoxyphenol hydroxylase and related FAD-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0110847
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCAGCCC CCCGCACAAT CATCGTTGCT GGTGCGGGAA TTGGCGGGCT GACGGCGTCG 
CTCGCGCTCG CGGCAAAGGG CTTCCGGGTC ATCAATCTGG AGAAGGCGGA ACGGCTCGAG 
GAAGCCGGCG CCGGACTCCA GCTTTCCCCC AACGCCAGCC GCGTGCTGAT CGATCTCGGT 
CTTGCCGGCC GGCTCGCGCA GCGCGCGATC GTGCCGGACG CGGTGACGGT GATGAGCGCG 
CGGACCGGCC GCGCGCTGGT GCGGCTGCCG CTCGGCGACG CCGCGGGCGC ACGCGCCGGC 
GCGCCCTATT GGGTGATCCA CCGCGCCGAT TTGCAAGCCG CGCTCGAAGC GCAGGTCAAC 
GCCCACCCGT CGATCGATCT GCGGCTCGGC TGCCGGTTCG AGGATTTCGC CAACGACGTC 
CACGGCGTCA GTATCGGCCA TCGCTGCCGC GCCGAGCGCA AGCAGGACTC TGCGCTGGCG 
CTGATCGGCG CCGACGGCAT CTGGTCGACG GTGCGCGGGA AATTGTTTCC GACGGCGCAG 
CCTCGTTTCA GCGGACTAAT TGCCTGGCGC GGCACGGTCG AGGCCAAGGC GCTGCCGCAA 
CGCGCCGCGC TCGCCGGCGT GCAGCTCTGG ATGGGACCGG ACGCGCATCT CGTGGTCTAT 
CCGATCTCCG GCGGGCGGCT CGTCAATCTG GTGGCGATTG TTGCGGACGA CTGGCGCCGC 
GAGGGTTGGA GCGCACCCGG CGACGCCCGT GACATCCAAC GCCGGTTCGC CGCCGCCGGC 
TGGGCGTCCG CGGCGAGGCT GCTGATTGAC TCGGTCGAAA ACTGGAAGCG CTGGGCGCTG 
TTCGCGATGC CGGATGGCGG GGTGTGGACC GCGGGCTCGA CCGCGCTGCT CGGCGACGCG 
GCGCATGGAA TGCTGCCGTT CGCAGCGCAG GGCGCGGGCA TGGCGATCGA GGACGCCGCG 
GTGCTGGCGA AATGCCTCGG CGAAAGCCAT GGCGCGGACG CTTCAGACGC CGCGCTCCCG 
GTTGCGGCGT CGCTCCAGCG CTACGCGCAG GCGCGCAGCA CGCGGGTGGC GCGGGTGCAG 
CGGCTGGCGC GGCAGAACGG CGGCATCTAT CACCTCAAGG GTCCGATCGC ACTGGCGCGC 
GATCTGGCGA TGCAGGCGCT CGGCGGCGAA CTGCTGCTGG CGCGGCAGAA TTGGATCTAC 
GACTGGCGGG CGTGA

Protein sequence

MSAPRTIIVA GAGIGGLTAS LALAAKGFRV INLEKAERLE EAGAGLQLSP NASRVLIDLG 
LAGRLAQRAI VPDAVTVMSA RTGRALVRLP LGDAAGARAG APYWVIHRAD LQAALEAQVN 
AHPSIDLRLG CRFEDFANDV HGVSIGHRCR AERKQDSALA LIGADGIWST VRGKLFPTAQ 
PRFSGLIAWR GTVEAKALPQ RAALAGVQLW MGPDAHLVVY PISGGRLVNL VAIVADDWRR 
EGWSAPGDAR DIQRRFAAAG WASAARLLID SVENWKRWAL FAMPDGGVWT AGSTALLGDA 
AHGMLPFAAQ GAGMAIEDAA VLAKCLGESH GADASDAALP VAASLQRYAQ ARSTRVARVQ 
RLARQNGGIY HLKGPIALAR DLAMQALGGE LLLARQNWIY DWRA