Gene HS_1047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_1047
Symbol	hemH
ID	4240545
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	1153936
End bp	1155066
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	38%
IMG OID	638104608
Product	ferrochelatase
Protein accession	YP_719259
Protein GI	113461190
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0276] Protoheme ferro-lyase (ferrochelatase)
TIGRFAM ID	[TIGR00109] ferrochelatase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.258045
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTAGGC ATTGTGCTGG GGATTTTTCT CGTATTTTTT GGCTTATCCA TTTCAGTAGA 
ACCTCTCAGA GCTATATTGG CACTCAATCT ATTGCTGGGA TTGGCAGTAG TAACCAACGG 
GATTCAACTC CTAACTGTTC AACTGATGAA AGAGAAATAG AGGGCTACCG AATGAAAAAA 
ATCGGTATTA TTCTTGCCAA TTTAGGTACA CCCGATGAAC CTACTCCTAA AGCATTATCT 
CGCTATTTAT GGCAATTTTT GACTGATCCA CGTGTAGTGG ATCTACCTAA ATGGCGTTGG 
TATCCGTTAC TTAAAAGCAT TATTTTGCCT CGCCGATCAG CTCGGGTCGC CAAAATATAT 
CAAACCGTTT GGACAGATAA AGGTTCTCCT TTACTTGTCA TTTCCAATCA ACAAAAGCAA 
GCGTTACAAT CCCACTTCGA TGAACACCGG ATTAATGCAA CAGTAGAAAT TGCAATGACG 
TATGGTAACC CGTCAATGGA AAGTGCGGTT GAAAAACTAT TGAAAAAGCA CGTGAATGAA 
ATCATCTTGT TACCCCTTTT CCCACAATAT AGCAGTACAA CTACCGGTGC TGTCTTTGAT 
GCTTTTGCAC AGGCATTAAA AAAACAACGC AACATTGTGC CTTTTCAGTT CATTCATTCA 
TACCATTTAC ATGAAGATTA TATCGAGGCA CTGGTAAATA GTATTAACGC TCAACACAAA 
CCGGATGAAT ACTTAATTTT TTCTTTTCAT GGCATACCGT TACGCTATGA AAATGAAGGA 
GATTATTATC GTAAACATTG TCATGAAACA GTTTTAGCTG TAGTAGAACG TTTAGGCTTG 
CGTGAAAATC AGTGGCAAAT GACGTTCCAA TCAAGATTCG GAAAAGAAGA ATGGTTGCAA 
CCTTATACGG ATAAAGTGTT GGAAAATATT TATCAACGAA ATATACAAAA AGTTGCCGTG 
GTTTGTCCCG GATTTTCCGC AGATTGTTTA GAAACAATCG AAGAAATTAA TGAAGAAAAT 
CGAAGAATTT TTCTCTCTCA TGGGGGAGCG TCTTTTCAAT ATATTCCCGC ACTTAATGCA 
GAAATGCAAC ATATTGAAAT GATGTATAAA TTAATCTCAA GTAGATTATA A

Protein sequence

MGRHCAGDFS RIFWLIHFSR TSQSYIGTQS IAGIGSSNQR DSTPNCSTDE REIEGYRMKK 
IGIILANLGT PDEPTPKALS RYLWQFLTDP RVVDLPKWRW YPLLKSIILP RRSARVAKIY 
QTVWTDKGSP LLVISNQQKQ ALQSHFDEHR INATVEIAMT YGNPSMESAV EKLLKKHVNE 
IILLPLFPQY SSTTTGAVFD AFAQALKKQR NIVPFQFIHS YHLHEDYIEA LVNSINAQHK 
PDEYLIFSFH GIPLRYENEG DYYRKHCHET VLAVVERLGL RENQWQMTFQ SRFGKEEWLQ 
PYTDKVLENI YQRNIQKVAV VCPGFSADCL ETIEEINEEN RRIFLSHGGA SFQYIPALNA 
EMQHIEMMYK LISSRL