Gene RPB_4542 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4542
Symbol	hemH
ID	3912359
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	5136270
End bp	5137307
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	64%
IMG OID	637886446
Product	ferrochelatase
Protein accession	YP_488136
Protein GI	86751640
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0276] Protoheme ferro-lyase (ferrochelatase)
TIGRFAM ID	[TIGR00109] ferrochelatase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.220243
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.879431
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGTGA TTGTCCCCAT TCACGGCCCT GCACCCGCTC TGGCACCTGC GCCCGAGCGC 
GTCGGCGTAT TGCTGGTCAA TCTCGGCACC CCCGACAGCT GCGACACCAA GGGCGTGCGG 
GTCTATTTGC GCGAGTTCCT GTCGGACCCG CGGGTGATCG AGAATCAGGG GATCTTCTGG 
AAGCTGGCGC TGAACGGCAT CATCCTGAAC ACCCGTCCGG CCCGCAAGGC CAAGGACTAC 
CAGAAGATCT GGAACCAGGA GAAGAACGAG TCGCCGCTGA AGACCATCAC CCGCGCGCAG 
GCCGAGAAGC TCGCCGCGTC GCTGAGCGAT CGCAGCCACC TGGTGGTGGA CTGGGCGATG 
CGTTACGGCA ACCCGTCGAT GCGCGACCGG ATCGAGGCGC TGGTGGCGCA AGGCTGCTCG 
CGGCTGCTGG TGGTGCCCCT CTATCCACAA TATTCGGCGG CGACCTCGGC CACCGTGTGC 
GACCAGGCGT TTCGCGTGCT GCGCGAATTG CGCGCCCAGC CGACGCTGCG GGTGACACCG 
CCTTACTACC GCGACGACGC CTATATCGAC GCGCTGGCGA ATTCGATCCA TGCGCATCTG 
GCGACGCTGC CGTTCAAGCC GGAGATGATC GTCGCCTCTT TTCACGGCAT GCCGCAGGCC 
TATATCGAGA AGGGCGATCC GTATCAGTCG CAATGCGTCG CCACCGTCGA TGCGCTGCGC 
GAGCGGATGG GGCTGGACGA CAAGAAGCTG CTGCTGACGT TCCAGTCGCG GTTCGGCTTC 
GACCAGTGGC TGCAGCCCTA CACCGACAAG ACCATCGAGA AGCTCGCCAA GGACGGCGTG 
CGCAAGCTCG CCGTGGTGAT GCCCGGCTTC GCCGCGGACT GCCTCGAGAC GCTGGAAGAA 
ATCGCGCAGG AGAATGCCGA GATCTTCATG CACAATGGCG GCGAGGAGTT CTCCGCGATC 
CCCTGCCTCA ACGACAGCGC CGACGGCATC GCGGTGATCC GGCAACTGGT GATGCGCGAA 
CTGGAAGGTT GGCTGTAG

Protein sequence

MTVIVPIHGP APALAPAPER VGVLLVNLGT PDSCDTKGVR VYLREFLSDP RVIENQGIFW 
KLALNGIILN TRPARKAKDY QKIWNQEKNE SPLKTITRAQ AEKLAASLSD RSHLVVDWAM 
RYGNPSMRDR IEALVAQGCS RLLVVPLYPQ YSAATSATVC DQAFRVLREL RAQPTLRVTP 
PYYRDDAYID ALANSIHAHL ATLPFKPEMI VASFHGMPQA YIEKGDPYQS QCVATVDALR 
ERMGLDDKKL LLTFQSRFGF DQWLQPYTDK TIEKLAKDGV RKLAVVMPGF AADCLETLEE 
IAQENAEIFM HNGGEEFSAI PCLNDSADGI AVIRQLVMRE LEGWL