Gene HS_0124 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_0124
Symbol
ID	4239632
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	-
Start bp	112001
End bp	113179
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	36%
IMG OID	638103653
Product	coproporphyrinogen III oxidase
Protein accession	YP_718328
Protein GI	113460270
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0635] Coproporphyrinogen III oxidase and related Fe-S oxidoreductases
TIGRFAM ID	[TIGR00539] putative oxygen-independent coproporphyrinogen III oxidase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACAAT TCTCCCTTGT TAAACTATTT CCCATTCAGC TACCTCCATT AAGTTTATAT 
ATACATATCC CTTGGTGTGT ACAAAAATGC CCTTATTGTG ATTTCAACTC CCATGCACAA 
AAGGGGTCTA TTCCGGAAAC TGAATATGTT ACCCATTTGC TTACTGACTT AAAGCAAGAT 
TTGGTACGTT ATCATGCCTC AATAGCCAAC CGAAAATTGC ATTCTATTTT CATTGGAGGC 
GGAACTCCTA GCCTATTTTC TGTACAAAGT ATTGATTATT TATTGAATCA AATTAAACAA 
CTTATTCCTT TTGAGGATAA TATTGAAATT ACGCTTGAGT CAAATCCTGT AACAGCTGAA 
AGCGATCGGT TTGTCGGATA TGCACAAGCC GGAGTGAATC GAATTTCTAT AGGGATTCAA 
AGTTTTAATA ATGAAAAATT ACAGAGACTG GGGCGTGCCC ATAATGCAGT TGAAGCAAAA 
AGTGCGGTGC GTTTTGCTCA ACATTCCGGA TTAAACAGTT TTAACTTGGA TTTAATGCAC 
GGATTACCCA ATCAATCTTT GGTGCAAGCA CTGGACGATT TACAGCAAGC TATTGCTTTA 
AAACCGCCTC ATTTATCTTG GTATCAACTC ACAATTGAGC CTAATACAAT GTTTGCATAT 
CGTCCGCCGA AATTACCCGA TGAAGATGAA CTTTGGGATA TTTTTGAGCA GGGTCATCAA 
TTGTTATCCA AAGCAGGTTA CCAACAATAT GAAACCTCTG CTTATGCAAA AGTTGATTTT 
CAATGTCAAC ACAATTTGAA TTATTGGAGA TTTGGTGATT ATTTAGCCAT TGGGTGTGGA 
GCACATGGTA AATTGAGTTT TGCTGATGGA CAAATTTTAC GTTTTTCTAA AACTAAACAC 
CCTAAAGGCT ATATGCGTGG TGAATATCTA TATGAGGAAA AAAATATCCC TTTTTCAGAA 
CGTCCATTTG AGTTTTTTAT GAATCGCTTT CGTTTATTGG AACCTATGGA AAAACAACAA 
TTTGAACTGT TAACTGGATT AGCACAAAGT GCGGTAGAAA AACAAATTGA TTGGGCGTTA 
GAGAAAAACT ATTTATCAGA AACGAACCGC ACTTGGCAAA TCACTGAACA AGGAAAACTT 
TTCCTTAATG AATTATTAAC GGAGTTTTTG CCTGATTAG

Protein sequence

MTQFSLVKLF PIQLPPLSLY IHIPWCVQKC PYCDFNSHAQ KGSIPETEYV THLLTDLKQD 
LVRYHASIAN RKLHSIFIGG GTPSLFSVQS IDYLLNQIKQ LIPFEDNIEI TLESNPVTAE 
SDRFVGYAQA GVNRISIGIQ SFNNEKLQRL GRAHNAVEAK SAVRFAQHSG LNSFNLDLMH 
GLPNQSLVQA LDDLQQAIAL KPPHLSWYQL TIEPNTMFAY RPPKLPDEDE LWDIFEQGHQ 
LLSKAGYQQY ETSAYAKVDF QCQHNLNYWR FGDYLAIGCG AHGKLSFADG QILRFSKTKH 
PKGYMRGEYL YEEKNIPFSE RPFEFFMNRF RLLEPMEKQQ FELLTGLAQS AVEKQIDWAL 
EKNYLSETNR TWQITEQGKL FLNELLTEFL PD