Gene RPB_3613 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3613
Symbol
ID	3911415
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	4148782
End bp	4150014
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	66%
IMG OID	637885515
Product	cytochrome P450
Protein accession	YP_487219
Protein GI	86750723
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.235331
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.886685
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAGCA ATAGCTCCGC GGAGTCGATC TCCGCGCCCC CGAACGACAG CACTATTCCG 
CATCTCGCGA TCGATCCGTT CTCGCTCGAC TTCTTCGACG ATCCCTACCC GGATCAGCAA 
ACCCTGCGCG ACGCCGGGCC CGTCGTCTAT CTCGACAAAT GGAACGTCTA CGGCGTGGCG 
CGCTACGCCG AGGTCCATGC GGTGCTCAAT GATCCGACGA CGTTCTGCTC CAGCCGCGGG 
GTTGGGCTCA GCGACTTCAA GAAGGAAAAG CCGTGGCGGC CGCCGAGCCT GATTCTCGAG 
GCCGATCCGC CGGCCCATAC GCGCCCGCGC GCGGTGCTCA GCAAGGTGCT GTCGCCGGCC 
ACCATGAAGA CCATCCGCGA CGGCTTCGCG GCGGCGGCCG ACGCCAAAGT CGACGAACTG 
CTGCAACGTG GCTGCATCGA TGCGATCGCC GATCTCGCGG AGGCCTATCC GCTATCGGTT 
TTTCCCGATG CGATGGGGCT GAAGCAGGAA GGTCGCGAGC ATCTGCTGCC CTATGCCGGC 
CTGGTGTTCA ACGCATTCGG GCCGCCCAAT GAATTGCGCC AGACTGCGAT CGAGCGCTCG 
GCGCCGCATC AGGCCTATGT CAACGAGCAG TGCCAGCGGC CGAACCTCGC TCCGGGTGGC 
TTCGGCGCCT GCATCCATGC CTTCACCGAC ACCGGCGAAA TCACCCCGGA CGAAGCGCCG 
CTGCTGGTGC GCTCGCTGCT GTCCGCGGGG CTGGACACGA CCGTCAACGG CATCGGCGCC 
GCAGTGTATT GCCTGGCCCG CTTCCCCGGC GAATTGCAGC GGCTGCGCAG CGATCCGACG 
CTGGCGCGCA ATGCATTCGA AGAAGCGGTG CGGTTCGAGA GCCCGGTGCA GACGTTTTTC 
CGGACGACGA CGCGCGAGGT CGAGCTCGGC GGCGCGGTGA TCGGCGAAGG CGAAAAGGTG 
CTGATGTTCC TGGGGTCCGC CAACCGCGAT CCGCGACGCT GGAGCGATCC CGACCTCTAC 
GACATCACCC GCAAGACCTC TGGCCATGTC GGCTTCGGCT CCGGCGTCCA TATGTGCGTC 
GGCCAGTTGG TGGCGCGGCT GGAGGGCGAA GTGATGCTGT CCGCGCTCGC CCGCAAGGTC 
GCCGCCATCG ACATCGACGG CCCGGTCAAG CGCCGCTTCA ACAACACGCT GCGCGGGCTG 
GAAAGCCTGC CGGTCAAGCT GACTCCTGCC TGA

Protein sequence

MISNSSAESI SAPPNDSTIP HLAIDPFSLD FFDDPYPDQQ TLRDAGPVVY LDKWNVYGVA 
RYAEVHAVLN DPTTFCSSRG VGLSDFKKEK PWRPPSLILE ADPPAHTRPR AVLSKVLSPA 
TMKTIRDGFA AAADAKVDEL LQRGCIDAIA DLAEAYPLSV FPDAMGLKQE GREHLLPYAG 
LVFNAFGPPN ELRQTAIERS APHQAYVNEQ CQRPNLAPGG FGACIHAFTD TGEITPDEAP 
LLVRSLLSAG LDTTVNGIGA AVYCLARFPG ELQRLRSDPT LARNAFEEAV RFESPVQTFF 
RTTTREVELG GAVIGEGEKV LMFLGSANRD PRRWSDPDLY DITRKTSGHV GFGSGVHMCV 
GQLVARLEGE VMLSALARKV AAIDIDGPVK RRFNNTLRGL ESLPVKLTPA