Gene HS_0021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_0021
Symbol
ID	4239529
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	22388
End bp	23446
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	36%
IMG OID	638103552
Product	Zn-binding dehydrogenase
Protein accession	YP_718227
Protein GI	113460170
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0554419
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGATTA ACTTTGTTAA AGAGGGAAAC ATTATGAGCA AATACGTAAG ATCAGTTTGT 
CTCGTGGAAC CTAAGAAGGT TGATATAAAG ACCGTGTTGT ATCCTAAAAA AGGTGAGTGT 
GATGTTCTGA TCAAAGTAGA GAGTATAGGA ATCTGCGGAT CTGATATTGG TGCATTTAGA 
GGTACTAATC CGCTGGTAAC TTACCCTAGA ATTTTAGGAC ATGAAATTGT TGGTACAGTC 
ATTGAATCTG GTGTTGGTAT GCCAAAAAAT ATTAATATAG GTGATCGTGT AATTCTCGAA 
CCTTACATTT ATTGTGGACA TTGCTATCCT TGTTCAATCA GTAGAACAAA TTGCTGTGAG 
GCACTAAAAG TTTTGGGGGT ACATATTGAT GGAGCAATGC AAGAAATTGT TAGACATCCA 
GCTCATATGC TTATTAAAGC ACCTGATATA CCGATACATG AACTGGCTTT AGCAGAACCT 
TTAACTATTT CATTACATGC AATTCGTAGA ACCAAAGTAA AAGCCGGTGA ACACGTTGCT 
ATCATCGGTG CTGGTGCGAT TGGACTGATG GCCGCATTAG TTGCCAAAGC TTATGGTGCG 
ACACCAATTT TAATTGACAT TTTAGACAAG CGATTAGATT ACGCAAAATC TATTGGCATT 
CCAAATATAA TTAACCCAGC AAAAGAAAAT GATCTTGAAG CTATTAAATC CATTACTAAC 
GGAAGAATGG CTGAGGTTGT TATTGAAGCG TCAGGAGCAA ATATTGCTGT ACAAAATACG 
CTTAAATATA CTTCTTTTGC AGGACGTATT GCTTTAACTG GATGGCCGAA AAACGAAACG 
CCACTACCAA CTAATTTAAT TACCTTCAAA GAACTTAACA TTTATGGAGC AAGAACAAGC 
AAGGGGGAAT TTGAAGAAGC ATTAAAACTT TTAGAATCGA GAAAGATTGA ACCGAAGAAT 
ATTATTAGTA AGGTAATTAC ATTTGATGAA ATTCCTCACT ACATCGAAGA GCTTTCAGAA 
AATCCTGATG ATTATTTAAA AATCATTGCT GTATTTTAA

Protein sequence

MSINFVKEGN IMSKYVRSVC LVEPKKVDIK TVLYPKKGEC DVLIKVESIG ICGSDIGAFR 
GTNPLVTYPR ILGHEIVGTV IESGVGMPKN INIGDRVILE PYIYCGHCYP CSISRTNCCE 
ALKVLGVHID GAMQEIVRHP AHMLIKAPDI PIHELALAEP LTISLHAIRR TKVKAGEHVA 
IIGAGAIGLM AALVAKAYGA TPILIDILDK RLDYAKSIGI PNIINPAKEN DLEAIKSITN 
GRMAEVVIEA SGANIAVQNT LKYTSFAGRI ALTGWPKNET PLPTNLITFK ELNIYGARTS 
KGEFEEALKL LESRKIEPKN IISKVITFDE IPHYIEELSE NPDDYLKIIA VF