Gene RPD_3440 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_3440
Symbol
ID	4023954
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	3824062
End bp	3825243
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	65%
IMG OID	637963644
Product	putative cytochrome P450
Protein accession	YP_570564
Protein GI	91977905
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0666165
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAACG CTCCGCATTT CGAGATCGAC GTCGCTTCGT TCTGGGCCGA TCCTTATCCC 
GCGCTTGCGA GGATGCGCGC CGAGGCGCCG ATCGCCTTCG TGCCGCAACT CGGCTCGACC 
ATCTTCACCC GGCGCGACGA CATCTTCGTC ACCGAGAAGC GCATCGACGT GTTCTCGTCG 
CACCAGCCGG CCGGCCTGAT GAACCGGTTG ATGGGCCACA ACATGATGCG CAAGGATGGC 
GACGCGCATA TCGCCGAGCG CAGCGCCTTG TTTCCAGCGG TGTCGCCGCG CACCGTGAAG 
GACGTATGGC GCGCACAGTT TCAGGCCCAT GCCGATCGGA TCCTCGACGA ACTCGCGCCG 
CAGGGTCACG CCGATCTGGT CAAGGCTTTC GCGCTGCCGC TGTCGGGTGA GTGCCTGAAG 
CACATCACCG GCCTCACCAA TATCAGCTAT CACGAGATGG ATTCGTGGTC GCAGGCGATG 
ATCGACGGCA TCGCCAACTA CACCGGCGAC AAGGCGGTCG AGGATCGTTG CCATGCGGCG 
ACTGCAGGCA TCGATGCCGC GATCGACGAC ATGGCCCCGG TGGTGAGCAA ACATTCCAAC 
CACTCGATGC TGAGCGTGCT GCTCGCCTCG GGCATGGCGA TGGACAGTAT CCGCGCCAAC 
ATCAAGCTCG CGATTTCGGG CGGGCAGAAC GAGCCGCGCG ACGCGATCGC GGGCTGCATC 
TGGGCGCTGC TGACGCATCC CGCAGAATAC GCCAAGGTCG TCGCCGGGGA TGCGAGCTGG 
CTCGCCGTGT TCGAGGAATA CGCCCGCTGG ATCGCACCGA TCGGAATGTC GCCGCGCCGC 
GTCGCGCAGC CGTTCCATTA TCGCGGCGTC GATTTCGAGC CGGAGGATCG GGTGTTCTTC 
ATGTTCGGCT CGGCCAATCG CGACGAGGCC TGCTTCACTG ATCCGGACCT GTTCGACGTC 
AGCCGCGATC ATGCCAAGAG CATCGCCTTC GGCGCTGGTC CGCATTACTG CGCGGGCGCC 
TTCGCCTCGC GCGCGATGGT CGCCGACGTC GCGCTGCCGA GTGTGTTCGC ACGGTTGAAA 
GCGCTGCGGC TCGACGAAGG CGAGCCGGTG CGGATCGGCG GCTGGGCGTT TCGCGGGCTG 
CTCAATCTGC CGGTCGCATG GAGCAGCGCC GCGCCGAATT GA

Protein sequence

MSNAPHFEID VASFWADPYP ALARMRAEAP IAFVPQLGST IFTRRDDIFV TEKRIDVFSS 
HQPAGLMNRL MGHNMMRKDG DAHIAERSAL FPAVSPRTVK DVWRAQFQAH ADRILDELAP 
QGHADLVKAF ALPLSGECLK HITGLTNISY HEMDSWSQAM IDGIANYTGD KAVEDRCHAA 
TAGIDAAIDD MAPVVSKHSN HSMLSVLLAS GMAMDSIRAN IKLAISGGQN EPRDAIAGCI 
WALLTHPAEY AKVVAGDASW LAVFEEYARW IAPIGMSPRR VAQPFHYRGV DFEPEDRVFF 
MFGSANRDEA CFTDPDLFDV SRDHAKSIAF GAGPHYCAGA FASRAMVADV ALPSVFARLK 
ALRLDEGEPV RIGGWAFRGL LNLPVAWSSA APN