Gene RPB_3971 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3971
Symbol
ID	3911778
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	4535830
End bp	4536927
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	61%
IMG OID	637885875
Product	magnesium-protoporphyrin IX monomethyl ester cyclase
Protein accession	YP_487575
Protein GI	86751079
COG category
COG ID
TIGRFAM ID	[TIGR02029] magnesium-protoporphyrin IX monomethyl ester aerobic oxidative cyclase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.209511
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.408306
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCCGA TGGAAGGTGG CGCCCAGAGC GCGCTGCGAA GCCGGCCGGC GATCAAGGGC 
AGTGTCGAAA GTCTGAACAT CGCGAAAGAG GATACCATCC TCACGCCGCG GTTCTACACC 
ACCGACTATG CCGCGATGGA CAAGCTCGAC GTCAGCCTGG TTCGTTCCGA ATGGAACGTG 
ATGATGAACG AGATGCGCGC CGACTACAAC AAGTCGCACT TCAAGAAGAA CGACGAGTTT 
CTGGAAAGCG ACCTCGACAA GCTGCCGCCG GCGCTGCGCG CCGAGTTCAA GGACTTCCTG 
GTGTCGTCGC TCACCGCGGA ATTTTCCGGC TGCGTGCTTT ACGCCGAGAT CAAGAAGCGC 
ATCAAGAATC CCGAAATCCG CGAATTGTTC GGTCTGCTGA GCCGCGACGA GGCCCGTCAT 
GCCGGCTTCA TCAACGAGAT CCTCAAGGAT CACGGCATCG GCGTCGACCT GTCGTTCCTG 
ACCAAGGTCA AGAAGTACAC CTATTTCCGG CCGAAGTTCA TCTTCTACGC GACCTATCTG 
TCGGAGAAGA TCGGCTACGC CCGCTACATC ACGATCTATC GCCAGATGGA GCGGCATCCC 
GAGCGCCGGT TCCATCCGAT CTTCAAATGG TTCGAGCGCT GGTGCAACGA CGAGTTCCGC 
CACGGCGAGG CTTTCGCGCT GCTGATGCGC GCCGACCCGT CGCTGCTTTC GGGCGTGAAC 
AAGCTGTGGA TCCGCTTCTT CCTGCTCGCC GTGTTCGCGA CGATGTACGT CCGCGATCAT 
ATGCGGCCGG CGTTCTACGA GGCGCTCGGC ATGGACGCCG CCGAGTACGG CATGCAGGTT 
TTCCGCATCA CGACCGAGAT CTCGAAGCAG GTTTTCCCGG TCACGATCAA CCTCGACGAC 
CCGCGCTTCC TGGCGGGCCT CGAGCGCCTG CGCGTGGCCT CGGAGAAGCT CGCCGACTGT 
CGCAGCCAAG GGTTCGTCGG CAAGCTGAAG CGGCCGTTCT ACGTGGCGTC TGCGGCGTTG 
GCCTTCGGCC GGCTTTTCCT TCTGCCGGCG AAGCGCAACG AGTTGCCGCG CGTCATCGGC 
CTTCGGCCGG CGTGGTGA

Protein sequence

MIPMEGGAQS ALRSRPAIKG SVESLNIAKE DTILTPRFYT TDYAAMDKLD VSLVRSEWNV 
MMNEMRADYN KSHFKKNDEF LESDLDKLPP ALRAEFKDFL VSSLTAEFSG CVLYAEIKKR 
IKNPEIRELF GLLSRDEARH AGFINEILKD HGIGVDLSFL TKVKKYTYFR PKFIFYATYL 
SEKIGYARYI TIYRQMERHP ERRFHPIFKW FERWCNDEFR HGEAFALLMR ADPSLLSGVN 
KLWIRFFLLA VFATMYVRDH MRPAFYEALG MDAAEYGMQV FRITTEISKQ VFPVTINLDD 
PRFLAGLERL RVASEKLADC RSQGFVGKLK RPFYVASAAL AFGRLFLLPA KRNELPRVIG 
LRPAW