Gene RPC_4842 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_4842
Symbol	hemH
ID	3973546
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	5403976
End bp	5405088
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	64%
IMG OID	637927954
Product	ferrochelatase
Protein accession	YP_534683
Protein GI	90426313
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0276] Protoheme ferro-lyase (ferrochelatase)
TIGRFAM ID	[TIGR00109] ferrochelatase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAGG CTCGATTTCG GCGAATGTTG CCTTATCTTG ACAACATTAT GCCAACGCGC 
GAAGCCAACC GCCTCATGAC AGTCATTGTT CCCATTCACG GCCCTGAGGC CGTTGCCGAT 
CAGGCGCCGG AACGGGTGGG CGTGCTGTTG GTCAATCTCG GCACGCCGGA CAGCGCCGAC 
ACCAAGGGGG TGCGTGACTA TCTGCGCGAG TTCCTGTCGG ATCCGCGCGT CATCGAGAAC 
CAGGGCATCG TCTGGAAGCT GGCGCTGAAC GGATTGATCC TGCGTACCCG CCCGGCGCGC 
AAGGCGCGCG ATTACCAAAA GATCTGGAAC AACGAAGCCA ACGAATCGCC GCTGAAGACC 
ATCACAAGGG CGCAGGCCGA CAAACTCGCC GCGACGCTGA CCGCGCACGA CCACATCGTG 
GTCGATTGGG CGATGCGCTA CGGCAATCCG TCGATGCGCT CGCGGATCGA CGCACTGGTC 
GCGCAAGGCT GCAACCGGCT GCTGGTGGTG CCGCTGTATC CGCAATATTC CGCGGCGACC 
TCGGCCACGG TCTGCGACCA GGCGTTCCGG GTGCTCAGCG AGATGCGCGC GCAGCCGACG 
CTGCGGGTGA CGCCGCCGTA TTATCGCGAC GCCGCCTATA TCGACGCGCT GGCCAATTCG 
ATCAGCAGCC ATCTGGCGAC GCTGCCGTTC GAGCCCGAAC GTATCGTCGC CTCGTTCCAC 
GGCATGCCGC AGGCCTACAT CAACAAGGGC GACCCCTACC AGTCGCATTG CATCGCCACG 
GTGGATGCGT TGCGCGAGCG CATGGGCCTC GACGAGAAGC GTCTGATGCT GACCTTCCAG 
TCGCGGTTCG GCTTCGATCA GTGGCTGCAG CCCTACACCG ACAAGACCAT CGAACAACTC 
GGCAAGGACG GCGTCCGCCG GCTCGCCGTG GTGATGCCGG GCTTCGCCTC GGACTGCCTG 
GAAACGCTGG AAGAAATCGC GCAGGAAAAC GCCGAGATCT TCATGCACAA TGGCGGCGAA 
AAGTTCGCCG CGGTGCCCTG CCTCAACGAC AGCGACGACG GCATCGCGGT GATCCGTCAA 
CTGGTGCTGC GCGAGCTCGA GGGCTGGCTG TAG

Protein sequence

MSKARFRRML PYLDNIMPTR EANRLMTVIV PIHGPEAVAD QAPERVGVLL VNLGTPDSAD 
TKGVRDYLRE FLSDPRVIEN QGIVWKLALN GLILRTRPAR KARDYQKIWN NEANESPLKT 
ITRAQADKLA ATLTAHDHIV VDWAMRYGNP SMRSRIDALV AQGCNRLLVV PLYPQYSAAT 
SATVCDQAFR VLSEMRAQPT LRVTPPYYRD AAYIDALANS ISSHLATLPF EPERIVASFH 
GMPQAYINKG DPYQSHCIAT VDALRERMGL DEKRLMLTFQ SRFGFDQWLQ PYTDKTIEQL 
GKDGVRRLAV VMPGFASDCL ETLEEIAQEN AEIFMHNGGE KFAAVPCLND SDDGIAVIRQ 
LVLRELEGWL