Gene RPB_3934 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3934
Symbol
ID	3911741
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	4488655
End bp	4489920
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	64%
IMG OID	637885838
Product	cytochrome P450
Protein accession	YP_487538
Protein GI	86751042
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.184448
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACGGCA CCATCGAGAT CGACAACGCC GCCCGCCAGC GCGCCGCGCG CGAGGAAGCC 
TATGCGACGC CGCTGTCGCA ATTCCACCCC GGCGCGCCGC GGCACTTCCG CGACGACACG 
CTGTGGCCGT GGTTCGAGCG GCTGCGCGCC GAGGAGCCGG TGCACTACTG CACCAACGCG 
CCGATCGCGC CGTATTGGAG CGTGACCAAG TACAACGACA TCATGCATGT CGACACCAGC 
CATCAGATCT TCTCGTCGGA TTCGACGCTC GGCGGCATTT CGATCCGCGA CGCGCCGCAG 
GGCTACGACT GGCCGAGCTT CATCGCGATG GACGAGCCGC GGCACTCGGC GCAGCGCAAG 
ACGGTGTCGC CGATGTTCAC GCCGGACCAT CTCGACGAAC TCGCGGTGCT GATCCGCGGC 
CGGACGCAGA AAGTGCTCGA TGGCCTGCCG CGCAACGAGA CCTTCAACTT CGTCGAGCGG 
GTCTCGATCG AGCTGACGAC GCAGATGCTG GCCACCTTGT TCGACTTCCC GTTCGCGCAG 
CGCCGCAAGT TGACGCGCTG GTCCGACGTC GCCACCGCGC TGCCCAAGAG CATGATCGTG 
GCGTCGGAGG AGGAACGCCG CAGCGAGCTG AACGAATGCG CCGCGACCTT CGCGGCGATG 
TGGAACGAGC GCGTCAATTC CGAGCCACGG AATGACCTGC TGTCGATGAT GGCGCATCAC 
GACGCCACAC GGCAGATGGA CCGCGACAAT CTGATCGGCA ACATCCTGCT GTTGATCGTC 
GGCGGCAACG ACACCACCCG CAACACCATG ACCGGCTCGG TGCTGGCGCT GAACCAGAAC 
CCGGACCAGT TCGCCAAGCT GCGCGCCAAC CCGGCGCTGA TCGACACCAT GGTACCCGAG 
GTGATCCGCT GGCAGACGCC GCTGGCGCAT ATGCGCCGCA CCGCCTTGCA GGACACCGAA 
CTCGGCGGCA AGACCATCAA GAAGGGCGAC CGGGTGGTGA TGTGGTACGT CTCCGGCAAC 
CGCGACGACG AGGTGATCGA GCGCCCGAAC GAGTTCATCA TCGACCGCAA GCGGGCGAAG 
ATCCATTTGT CGTTCGGCTT CGGTATCCAC CGCTGCGTCG GGATGCGGCT GGCCGAATTG 
CAACTGAAGA TCGTCTGGGA AGAAATGCTC AAACGGTTCG AGCGCATTGA AGTTGTCGGG 
GAGCCGAAGC GGGTGTATTC GAGCTTCGTC AAGGGCTACG AGTCCTTGCC GGTTCGCATC 
TCATGA

Protein sequence

MHGTIEIDNA ARQRAAREEA YATPLSQFHP GAPRHFRDDT LWPWFERLRA EEPVHYCTNA 
PIAPYWSVTK YNDIMHVDTS HQIFSSDSTL GGISIRDAPQ GYDWPSFIAM DEPRHSAQRK 
TVSPMFTPDH LDELAVLIRG RTQKVLDGLP RNETFNFVER VSIELTTQML ATLFDFPFAQ 
RRKLTRWSDV ATALPKSMIV ASEEERRSEL NECAATFAAM WNERVNSEPR NDLLSMMAHH 
DATRQMDRDN LIGNILLLIV GGNDTTRNTM TGSVLALNQN PDQFAKLRAN PALIDTMVPE 
VIRWQTPLAH MRRTALQDTE LGGKTIKKGD RVVMWYVSGN RDDEVIERPN EFIIDRKRAK 
IHLSFGFGIH RCVGMRLAEL QLKIVWEEML KRFERIEVVG EPKRVYSSFV KGYESLPVRI 
S