Gene Tbd_2033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tbd_2033
Symbol	hemH
ID	3672204
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thiobacillus denitrificans ATCC 25259
Kingdom	Bacteria
Replicon accession	NC_007404
Strand	+
Start bp	2124162
End bp	2125265
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	68%
IMG OID	637710735
Product	ferrochelatase
Protein accession	YP_315791
Protein GI	74318051
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0276] Protoheme ferro-lyase (ferrochelatase)
TIGRFAM ID	[TIGR00109] ferrochelatase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.814285
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATACG CCGAAGAGCC CGAATACGCG CACGGAACGC CGCTGTGCGC AGGCGTCCTG 
CTGGTCAATC TGGGCACCCC CGAGGCGCCG ACGGCCGCTG CCCTGCGGCC TTATCTCAAG 
GAATTCCTGT CCGACCCGCG CGTGGTCGAA ATCCCGCGCG CGCTCTGGTG GCTCGTGCTG 
AACGGCATCA TTCTCAACAC CCGGCCGCGC AAGTCGGCCG AAAAATACGC CGCGATCTGG 
ACCAGCGAGG GGTCACCGCT GAAGGTCCAC ACCGAAAAGC AGGCGAAACT CCTCAAGGGC 
TGGCTCGGTG AGCACGCCGC CGCGCCGGTC GTCGTCGACT ACGCGATGCG CTACGGCCGG 
CCGGGGATCC CGGAGGTTCT CGCACGAATG AAGGCCGCCG GCTGCGACCG TATCCTCGTA 
CTGCCGGCCT ATCCGCAATA CGCCGCGTCG AGCACGGCGA CCGCGTTCGA CGCGGCGTTC 
GACTGGCTGC GCAGAACGCG CAATCAGCCG GCACTGCGCA CGCTCAAGCA CTACCACGAC 
CACCCCGAGT ACATCCGCGC ACTCGCCGCC AACCTGCGCG ACTACTGGCA GATGCACGGC 
CGCCCCGACG TCCTCGTCAT GAGCTTCCAC GGCGTGCCGC GCTACACGCT CGACAAGGGC 
GACCCCTATC ACTGCGAATG CCAGAAGACG GCGCGCCTGC TCGCCGCCGC ACTCGGCCTC 
GAGCCGGGTC AGTTCCGCGT GACCTTCCAG TCGCGCTTCG GCCGGGCCGA ATGGCTCAAA 
CCCTATACCG ACAAGACGCT CGAAGCGCTC GGCCGCGAGG GCGTCGGACG GGTCGACGTC 
GTTGCGCCGG GTTTCACGGC CGATTGCCTG GAGACGCTCG AGGAACTCGC GATGGAGGGA 
CGCGCGAGCT TTCTCGCCGC CGGCGGCAAG GAATTCCACT ACGTCCCCGC GCTCAACGAG 
CACCCGCAAT GGATCGCCGC ACTCGGCAGG ATCGCGCTCG CCAACCTCGC GGGCTGGCTC 
GACGAGGGCT GGACACCCGA CGCCGACGAG GCGTCGCGTC AGCTCAGCAG AAGCCGCGCG 
CTCGCGCTGG GCGCGCAACG CTGA

Protein sequence

MKYAEEPEYA HGTPLCAGVL LVNLGTPEAP TAAALRPYLK EFLSDPRVVE IPRALWWLVL 
NGIILNTRPR KSAEKYAAIW TSEGSPLKVH TEKQAKLLKG WLGEHAAAPV VVDYAMRYGR 
PGIPEVLARM KAAGCDRILV LPAYPQYAAS STATAFDAAF DWLRRTRNQP ALRTLKHYHD 
HPEYIRALAA NLRDYWQMHG RPDVLVMSFH GVPRYTLDKG DPYHCECQKT ARLLAAALGL 
EPGQFRVTFQ SRFGRAEWLK PYTDKTLEAL GREGVGRVDV VAPGFTADCL ETLEELAMEG 
RASFLAAGGK EFHYVPALNE HPQWIAALGR IALANLAGWL DEGWTPDADE ASRQLSRSRA 
LALGAQR