Gene RPB_3631 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3631
Symbol
ID	3911433
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	4167329
End bp	4168528
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	63%
IMG OID	637885533
Product	cytochrome P450
Protein accession	YP_487237
Protein GI	86750741
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.525721
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAGC GAGCGCCTGT CACCGATTGG GCCAGCGACT TCGACCACAC CGACCCGCGC 
TGGACCGAAA ACCCCTATCC GATCTGGGAC GAACTGCGCG CGGCGAGCCC GGTCGTCCAC 
ACCGACCGCT TCCTGGGCGT CTATATGCCG ACCACCTTCG CGGCGGTGAA GGAGATTTCC 
TACGACACCG ACCACTTCTC GTCGCGGCGC ATCATCGTCC GCAACAGCCG GCCCGAGCCG 
GTGCAATCGG CGCCGCCGAT TACTTCAGAT CCGCCGGAAC ACAAGCCGGC CAAGCGCCTG 
CTGCTGCCGC CGTTCACGCC CGATGCGGTG GCCAAGCTCG AGCCGCGGGT TCGCTCGATC 
TGCAATGAAC TGATCGACGA TTTCATCGCG GATGGTCGCT GCGACGCCGC GAAGGCCTAC 
AGCAAGCACA TTCCGGTCAA GACGATCTGC GCGATGCTCG GCATTCCAGA GACCGACAGC 
GACCGGTTCA TCCAGTGGAT TCACGAAATC CTCGAACTCG GTATCCATGA CGACGCGATG 
CTGATGAAGG CGATTCAGGA AATGAGCGTG TACTTCGCCG GCCACATCGC GAAGCGCAAG 
CAGCATCCGA CCGACGATCT GATCAGCACG CTGATGAACG CGCGCGATGC CGACGGCCAG 
CCACTGTCCG ATGTCCATGT GCTCGGCTCG TTGCGCCTGC TGCTGATCGC CGGCATCGAC 
ACGACGTGGA GCGCGATCGG CGCGGCGTTG TGGCATCTGG CGACGCATCC GGAAGATCGC 
GTCCGGCTTG TCGCCGAGCC GGACCTGATG TCGACGGCTA TCGAAGAACT TCTCCGCGCC 
TATGCGCCGG TCACCATGGC CCGCGAGGTG ATGAAGGAGA CCACGATCGC CGGCTGCCCG 
GTGAAGCCCG GCAACATGGT GTTGCTGTCG TTCCCCGCCG CCAACCGCGA TCCCGACGTC 
TTCCCCGACG CCGATCGGGT CAAGATCGAC CGCCAAGAAA ATCCTCACGT CGCGTTCGGC 
CTCGGTATTC ACCGCTGCGT CGGGTCCAAC TTGGCGCGAA TGGAGATGAC GGTTGCGATC 
GAGGAATGGC TGAAACGGAT TCCGGAGTTT AGACTGGATT CGTCACAAAA TGTGCGCTGG 
TCGGAAGGTA CGGTTCGTGG CCCGCGCCAA CTGCCGCTGC TGCTCGGCCA GCCGAGCTGA

Protein sequence

MTERAPVTDW ASDFDHTDPR WTENPYPIWD ELRAASPVVH TDRFLGVYMP TTFAAVKEIS 
YDTDHFSSRR IIVRNSRPEP VQSAPPITSD PPEHKPAKRL LLPPFTPDAV AKLEPRVRSI 
CNELIDDFIA DGRCDAAKAY SKHIPVKTIC AMLGIPETDS DRFIQWIHEI LELGIHDDAM 
LMKAIQEMSV YFAGHIAKRK QHPTDDLIST LMNARDADGQ PLSDVHVLGS LRLLLIAGID 
TTWSAIGAAL WHLATHPEDR VRLVAEPDLM STAIEELLRA YAPVTMAREV MKETTIAGCP 
VKPGNMVLLS FPAANRDPDV FPDADRVKID RQENPHVAFG LGIHRCVGSN LARMEMTVAI 
EEWLKRIPEF RLDSSQNVRW SEGTVRGPRQ LPLLLGQPS