Gene HS_0018 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_0018
Symbol
ID	4239526
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	19007
End bp	20050
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	25%
IMG OID	638103549
Product	hypothetical protein
Protein accession	YP_718224
Protein GI	113460167
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0476] Dinucleotide-utilizing enzymes involved in molybdopterin and thiamine biosynthesis family 2
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATATA TCACTTCTAA ACATGTATTT TTTGACTATC TAAATGAAAA TGAATTTGTT 
ATTGGGATAG GTAGTAACCA AGAAATTACA AACAACAAAG ATTATTTTAA TAATTGTCTA 
AATTTATGTT ATTTTTGTAT AAATCCTAAG AGCATTTCTG AAATATTATC TTTTATAAAA 
GATAATAATA TAGACATTCT ATATTTCGAT AAAATGAAGA AAATGAAGTT TATTACAAAA 
GAAATAATAG ACTTCAATGA TAGATACAGT AGAAATCATT TATACTATAA TGCATTAGGA 
TATAAAATAT ATGATATACA AAATAAAATA TCTAAATCTC ATATTCTTAT TGTTGGTGCA 
GGAGGCATAG GAAATATTTG CTCCTATTTA TTAGGAACAA TAGGAATTAA GAAGTTAAGT 
ATCATTGATG ATGATATAGT TGAGGAATCT AATCTAAACA GACAGTTCTT ATTTCGAGAG 
AAAGACATAA ACAAAAATAA AGTAGAAACA ATAAAAAGAG AGTTATTATC TATTCGGAAA 
GATATTATTA TTGATATTTT CCCAGAGAAA TTAAATAAAT CTATTTTAGA TAAAATATCA 
CAAATAGATT TAGTTATTTG TTCAGCAGAT GATGAGTATT GTATAGATAT GATTAATGAA 
TTTTGCTGTT TTAATAAAAT TCCTCTAATT AACGTAGGTT ACCTCAATGA TATTTCTGTT 
ATCGGACCAT TCTACATTCC AAAGTTAGAA TATAGCTGTT GTTTATGTTG TGATAAGTCT 
ATATATTTAG AAAATGATGT TATAGATGAA AAAGTGAAGA AAATTAAATC AGTTACGAAA 
GCACCATCTA CTATCATTAA TAATTTCTTT GCTGGTGCTA TGCTTGGTTC AGAACTTATT 
AAATTCTTTG CGTGCGATTA CAAATCAATG CAAAGTATTA ATTCTGTAAT AGGAATTCAC 
AATAAGAATT TTAAGTATGA AGAAATTAAG TTAGCTAGAA ATTATAATTG CAAATATTGT 
GGAGTAAATA ATGAGACACT ATGA

Protein sequence

MKYITSKHVF FDYLNENEFV IGIGSNQEIT NNKDYFNNCL NLCYFCINPK SISEILSFIK 
DNNIDILYFD KMKKMKFITK EIIDFNDRYS RNHLYYNALG YKIYDIQNKI SKSHILIVGA 
GGIGNICSYL LGTIGIKKLS IIDDDIVEES NLNRQFLFRE KDINKNKVET IKRELLSIRK 
DIIIDIFPEK LNKSILDKIS QIDLVICSAD DEYCIDMINE FCCFNKIPLI NVGYLNDISV 
IGPFYIPKLE YSCCLCCDKS IYLENDVIDE KVKKIKSVTK APSTIINNFF AGAMLGSELI 
KFFACDYKSM QSINSVIGIH NKNFKYEEIK LARNYNCKYC GVNNETL