Gene RPB_2687 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_2687
Symbol
ID	3910480
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	3071354
End bp	3072880
Gene Length	1527 bp
Protein Length	508 aa
Translation table	11
GC content	66%
IMG OID	637884587
Product	magnesium-protoporphyrin IX monomethyl ester anaerobic oxidative cyclase
Protein accession	YP_486300
Protein GI	86749804
COG category	[C] Energy production and conversion
COG ID	[COG1032] Fe-S oxidoreductase
TIGRFAM ID	[TIGR02026] magnesium-protoporphyrin IX monomethyl ester anaerobic oxidative cyclase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTATCC TTCTGGTCAA CGTTCCCCAT CCCGCCATCG GCAGCCTGAT TCCGAGCGAT 
CACTTGCCGC CGCTGGGCCT GCTGGCGATC GGCGGACCGC TGATTGATGA CGGCCATGAC 
GTGCGTTTGC TTGATGCCGA GTTCGGCCCG ACGTCGACCG CGCAGATCGT CGGACAGGCG 
CGCGACTTCC GTCCCGATGC GGTGCTGTTC GGCCATTCCG GGTCGACCTC CGGCCACCCG 
GTCATCGCCG AAGTCGCACA GGCCATCGCG CATGCCATTC CCGGCACGCG CATTGTCTAT 
GGAGGTGTGT TTCCGACCTA CCACTGGCGG GAGATCCTCG ACGCCGAGCC TTACGTCACG 
GCCATCGTGC GTGGGGAGGG CGAGGAGACG GCGCGGCGCT TGATGACCGC ACTCGCTGAT 
GGCGATGATC TCGCGGGCGT CCATGGGATT GCCTATCGCA GAGCCGGGCA AGCCTGCGCG 
ACGCCGCCGG CCGTGGTGAT CGGAGATCTC GACGCCTATC GGATCGGTTG GGAACTGATC 
GACCACGCTC GCTACAGCTA TTGGGGCGGA CTGCGCGCCG TCGTGGTGCA ATTCTCGCGA 
GGCTGCCCAC ATCTGTGCAG TTACTGCGGA CAACGCGGCT TCTGGACGCG CTGGCGGCAC 
CGCGATCCCG TGCTGTTCGC CAAGGAGCTC GCGCGGCTGC ATCGGGAGCA GGGCGTCCGG 
GTCGTCAATT TCGCCGACGA GAACCCGACG GTCTCGAAGA AGGTGTGGCA GACGTTCCTC 
GAGGCGTTGA TCGCGGAGGA GGTCGACCTG ATCCTGGTGG GGTCGACCAG GGCCGACGAC 
ATCGTCCGCG ACGCCAATAT CTTGCATCTG TACAAGCAGG CCGGCTGGGA TCGCTTCCTG 
CTCGGCCTGG AAAACACCGA CGACGCCACG CTGGCGCTGA TCCGCAAGGG CGCGGCAACG 
CCCACCGATC GCGAGGCCAT TCGGCTGCTG CGTCGGCACG GCATCCTATC GATGGCCACC 
TGGGTGGTCG GCTTCGTCGA GGAGACCGAC CGCGATCACT GGCGCGGGCT GCGCCAGCTT 
CTCTCGTACG ACCCGGACCA GATTCAGATG CTGTACGCGA CGCCGCACCG CTGGACGCCA 
TATTTCGGGC AGGCGGCCGA ACGCCGGGTG ATCACGACTG ACCGGCGGCA CTGGGACTAC 
AAGCATCAGG TCCTCGCCAA TCGCAACATG CCGCCGTGGC GCGTCCTGCT CTGGTTCAAG 
TTCACCGAGC TGGTGCTTCA AGCCCGCCCG AAGGCGATGT TTCGCACCTT CTTCGAGCGC 
CGCGGGCGCC TGCGTCATGC CATGCAATGG TACACGCGGA TCGGACGCCG GGTCTGGCCC 
TACGAGATCT GGCAGTTCCT GCGAGCCCGG CATTTGAAGA CCGGACCGAC CGTCGGCGAA 
TTCTGGGGCG ACGGCCAAGT GGTCGATGAG AACGCGATGG CCACATCGCG GCAACGACGC 
CAGCTTCCCA ATCAAAGCGC CGCCTGA

Protein sequence

MRILLVNVPH PAIGSLIPSD HLPPLGLLAI GGPLIDDGHD VRLLDAEFGP TSTAQIVGQA 
RDFRPDAVLF GHSGSTSGHP VIAEVAQAIA HAIPGTRIVY GGVFPTYHWR EILDAEPYVT 
AIVRGEGEET ARRLMTALAD GDDLAGVHGI AYRRAGQACA TPPAVVIGDL DAYRIGWELI 
DHARYSYWGG LRAVVVQFSR GCPHLCSYCG QRGFWTRWRH RDPVLFAKEL ARLHREQGVR 
VVNFADENPT VSKKVWQTFL EALIAEEVDL ILVGSTRADD IVRDANILHL YKQAGWDRFL 
LGLENTDDAT LALIRKGAAT PTDREAIRLL RRHGILSMAT WVVGFVEETD RDHWRGLRQL 
LSYDPDQIQM LYATPHRWTP YFGQAAERRV ITTDRRHWDY KHQVLANRNM PPWRVLLWFK 
FTELVLQARP KAMFRTFFER RGRLRHAMQW YTRIGRRVWP YEIWQFLRAR HLKTGPTVGE 
FWGDGQVVDE NAMATSRQRR QLPNQSAA