Gene HS_0047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_0047
Symbol	hemY
ID	4239555
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	50760
End bp	52037
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	37%
IMG OID	638103578
Product	porphyrin biosynthesis protein
Protein accession	YP_718253
Protein GI	113460196
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG3071] Uncharacterized enzyme of heme biosynthesis
TIGRFAM ID	[TIGR00540] hemY protein

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCAGAG TTCTATTTTT AATGCTGGTT TTATTGGCTG GATTAATTGG CGGTCCCTAT 
TTATCAGGTA AACAGGGATA TGTGTTAATT CAAACGGCAA GCTATAACAT CGAAATGTCA 
ATCACGATGT TGGTTATTTT CTTTGTGATT TTAATGGCCA TTGTTTATCT GATTGAATGG 
GTGGTTACAC GTTTCTTCCG TTTGAGTAAT AATACCTATA GTTGGTTCTC TCGTCGTAAA 
CGTGTTAAGG CACAACGTCA AACTTTGGAA GGTTTAGTGA AGATGAATGA GGGCGATTAT 
TCCAAAGCTG AGAAATTGAT TGGAAAAAAT GCTAGACATT CAGATAAACC AATATTGAAT 
TTAATTAAAG CGGCGGAAGC GGCACAACAG CGAGGCGATG ATTTTGTTGC CAATCGCTAT 
TTAATTGAAG CAACAGAATT AGCAGGTACA GACAGTTTAA TTGTCGAAAT TGCACGTACT 
AGAATTTTAT TGCAACAAAA TAAACTTCCG GCAGCTCGTA GTTCGGTGGA TAGTTTACTG 
GAGATGACCT CTCGTAATAA AGAAGTATTA AAGCTGGCAG TGAAAATTTA CCTGAAATCT 
GCCGCCTTCC ACGCATTGGA TAAAATTCTA GATCAAATTG AAAAAGTTGG ATTATATTCT 
TCCGATGAAT TCACCGCCCT TCAGCGTAAA GTCGAAGATG GTTTATTAGA CGAGAAAATG 
AACGAAGAGG GTGTTGATGG GTTATTACGT TGGTGGGATG AACAGCCTCG TAAACGCCGT 
AATGATTTAT ATGTTAAGGT TGGTTTAATT CGTCGTTTAC TGGACAGTGA TGATCATGAA 
AGTGCTTATG AGTTAGCTAT TGATGCTCTG AAAAAAGTTG AAAATAGTGT TGAAGCTAAT 
GTTGCTCTTT GTACTCAAAT TACTCGTTTA CAACCGGAAG ATAACAGTAA GTTATTAAAA 
CTTTTGGAAA AACGTGCAAA ACAGTCAAAC AGTAAAGATT GTTGCTGTGT TGAACGTGCG 
TTAGGTTACC TTTATGTGCG TAATGATGAT TTCGCTAAAG CGGCAGAAGC ATTCAAGAAA 
GTGATAGAGA ATAAAGCGAG CTTACAAGCA AATGATATTA CTATGGCGGC TTATGTTTTC 
GAACAGGTTG GAGAGCTTGA ATTAGCACAA AAAGTTCGTG AGGAAGGATT GAGAAATGCG 
ATGTCAATTA AAGAGTCGGA AAATAAAACC AAAAAAACAG CAGAAAATCC GACCGCCCTT 
TTAGAACAAA AATCCTAA

Protein sequence

MFRVLFLMLV LLAGLIGGPY LSGKQGYVLI QTASYNIEMS ITMLVIFFVI LMAIVYLIEW 
VVTRFFRLSN NTYSWFSRRK RVKAQRQTLE GLVKMNEGDY SKAEKLIGKN ARHSDKPILN 
LIKAAEAAQQ RGDDFVANRY LIEATELAGT DSLIVEIART RILLQQNKLP AARSSVDSLL 
EMTSRNKEVL KLAVKIYLKS AAFHALDKIL DQIEKVGLYS SDEFTALQRK VEDGLLDEKM 
NEEGVDGLLR WWDEQPRKRR NDLYVKVGLI RRLLDSDDHE SAYELAIDAL KKVENSVEAN 
VALCTQITRL QPEDNSKLLK LLEKRAKQSN SKDCCCVERA LGYLYVRNDD FAKAAEAFKK 
VIENKASLQA NDITMAAYVF EQVGELELAQ KVREEGLRNA MSIKESENKT KKTAENPTAL 
LEQKS