Gene Rsph17029_2858 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_2858
Symbol	hemH
ID	4897575
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	3015086
End bp	3016219
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	65%
IMG OID	640113461
Product	ferrochelatase
Protein accession	YP_001044732
Protein GI	126463618
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0276] Protoheme ferro-lyase (ferrochelatase)
TIGRFAM ID	[TIGR00109] ferrochelatase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGGAA GCGGAATGAC GCCGATGCTG CAAGCGACGC CCGAGCAGGC GCGAACCCTG 
GGGGCTGAAG AGCCCATCCG TCCGGGTCAG GACCGGCTCG CCCATGCGCC CGCAGACCAT 
CCGGAGCTGC CGCAGCCCAA GATCGGCATC CTGCTCGCCA ATCTCGGCAC GCCGGACAAT 
TACGACTACT GGTCGATGCG CCGCTACCTG AACGAGTTTC TCTCGGACAA GCGGGTGATC 
GACTACCCCG CCTGGAAGTG GCAACCGCTG CTGCAGATCC TGATCCTGTC CAAGCGCCCC 
TTCTCGTCGG GCGCCAACTA CAAGCTGATC TGGAACCATG ACAAGGGCGA GAGCCCGCTC 
ATGACGATCA CCAAGGACCA GACAGCCGCC ATCGCCGCCG AGATCCGCAG TCTCTACGGC 
AACCGCGTCA TGGTCGATTT CTGCATGCGC TACGGCAACC CCTCGACCGA GAGCCGCGTG 
CGGGCCATGG TCGAGGCGGG CTGCGAGAAG ATCCTCTTCT TCCCGCTCTA TCCTCATTAT 
GCGGGCGCAA CCTCGGCCAC GGCGAACGAC GAGTTCTTCC GGGCCATGAT GAAGGAAAAG 
CGGCAGCCCG CGGTGCGGAC CGTGCCGGAA TATTACGACA ATCCGCTCTA CATCGACGCG 
CTCGCGCAGT CGGTCGAGCG CGCCTATGCC CAGCTCGACC ACAGGCCGGA CGTGCTGGTG 
GCCTCCTATC ACGGGATGCC CAAGCGGTAT CTGATGGCGG GCGATCCCTA CCATTGCCAG 
TGCGCCAAGA CCTCGCGCCT GCTGCGCGAG CGGCTGGGAT GGGAGAAGGG CGCGATCGAC 
ACCACCTTCC AGTCGGTCTT CGGACCCGAG GAATGGCTCA AGCCCTATAC GGTCGAGCAT 
GTGGCGGAGC TTGCCCGCGC CGGGAAGAAG CGCATCGCGG TGATCGCGCC GGCCTTCTCG 
GCGGACTGCA TCGAGACGCT GGAAGAGATC AACGGCGAGA TTCGCGAGGC CTTCGAGGAA 
GCAGGCGGCG AGGAGTTCAC CTACATCCCC TGCCTGAACG ACGACGAGGC GCATATCCGC 
GCGCTGGTCT CGGTGATCGA GGACAATCTC GCAGGCTGGC TCGCGCGCGG CTGA

Protein sequence

MSGSGMTPML QATPEQARTL GAEEPIRPGQ DRLAHAPADH PELPQPKIGI LLANLGTPDN 
YDYWSMRRYL NEFLSDKRVI DYPAWKWQPL LQILILSKRP FSSGANYKLI WNHDKGESPL 
MTITKDQTAA IAAEIRSLYG NRVMVDFCMR YGNPSTESRV RAMVEAGCEK ILFFPLYPHY 
AGATSATAND EFFRAMMKEK RQPAVRTVPE YYDNPLYIDA LAQSVERAYA QLDHRPDVLV 
ASYHGMPKRY LMAGDPYHCQ CAKTSRLLRE RLGWEKGAID TTFQSVFGPE EWLKPYTVEH 
VAELARAGKK RIAVIAPAFS ADCIETLEEI NGEIREAFEE AGGEEFTYIP CLNDDEAHIR 
ALVSVIEDNL AGWLARG