Gene HS_0046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_0046
Symbol	hemX
ID	4239554
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	49546
End bp	50745
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	35%
IMG OID	638103577
Product	uroporphyrin-III C-methyltransferase
Protein accession	YP_718252
Protein GI	113460195
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG2959] Uncharacterized enzyme of heme biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.120112
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAGAG AGAATGAACA AGTTGGCGAA AAAAGAACAG CAGCTCAAGT TGAAACTGTA 
GTGGTGAAAA AAGGAGGGAC AGTCATTGCT CTATTAGCTT TGCTTATTGC ATTGGGTATT 
GGGGGAGCTG GCTATTATTT TGGTCAACAA AAAGTAGAAG AAATTCAGCA AAAGTTGACC 
GCACTTAGCC AACCGTCGGA AGCTATGCCG TCGGAAAACA ATGATACTTT GTTGGCAACA 
ATTGAAGAAT ATAAGCAAAC TTTTATACAG AAGATTGAGC GACTGGAAAA TGAAATGACA 
AAACAAAACC AGCTTATTCA AAGTTTACAA GCACAAGTAA ATAAATTGGA TGCGGTTGGT 
AAAGTTGAAC AATCGACGGA TTGGTTGTTG TTTGAAACAG ATTATTTGTT GAATAATGCT 
TTACGTAAAA TCGTATTGGA TAATGATGTG GAGACAGCTA TTGCGTTATT GAAAGTGGCG 
GATGAAACAC TCGTTAAGGT TAATGATCCT AAAGTCATTA ATATTCGTCA GGCAATTAAT 
GCAGATTTAA AACAGTTATT ATCAGTAAAT AATGTAGATC AAAATGCCAT CATGCAACAT 
TTATCTCAAT TAGCAAACGG TATTGATGAA TTAGTTGTAT TAAATGTGAA TTTCGATGAG 
CAAGAAAATA CTCAATTAAG CGATTCCTTA CAGGATTGGA AAGAAAACGT AGAAAAAAGT 
GCGGTATCTT TTTTAAATCA TTTTATTCGT GTAAAACCTC GCCATGTGAA CTCAAAGGAA 
TTACTTGCAC CAAATCAAGA TATTTATTTA CGTGAAAATA TTCGTTTACG TTTGCAAATT 
GCGATTATGG CGGTCCCTCG TCAGCAAAAT GATTTATATA AACAATCACT TGAAATTGTA 
GGTTCTTGGA TAAGAAGCTA TTTTGATACA AGCACTGAAG TGGCACAAAA CTTCTTGAAA 
GAGATTGATG AACTTGCTGA GAAATCTATC TATGTTGATG TTCCTAACCA ATTAAAAAGT 
TTGCTTTTGT TGGATAAGTT ATTGAATAAG GAACAGTCAT CTGTACAAAA AATTGAAATG 
ACAGTAGATA AAGACTTGGT TAGCTCAACA GATCAAGTAT CTGAGGAAGG GAAAACAGAT 
CAAGCTGTTG AAAAATCTGA TGAAAAGCCA ATTGAACAGC CTGTTGAGCA AGCACAGTAA

Protein sequence

MERENEQVGE KRTAAQVETV VVKKGGTVIA LLALLIALGI GGAGYYFGQQ KVEEIQQKLT 
ALSQPSEAMP SENNDTLLAT IEEYKQTFIQ KIERLENEMT KQNQLIQSLQ AQVNKLDAVG 
KVEQSTDWLL FETDYLLNNA LRKIVLDNDV ETAIALLKVA DETLVKVNDP KVINIRQAIN 
ADLKQLLSVN NVDQNAIMQH LSQLANGIDE LVVLNVNFDE QENTQLSDSL QDWKENVEKS 
AVSFLNHFIR VKPRHVNSKE LLAPNQDIYL RENIRLRLQI AIMAVPRQQN DLYKQSLEIV 
GSWIRSYFDT STEVAQNFLK EIDELAEKSI YVDVPNQLKS LLLLDKLLNK EQSSVQKIEM 
TVDKDLVSST DQVSEEGKTD QAVEKSDEKP IEQPVEQAQ