Gene HS_0049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_0049
Symbol
ID	4239557
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	-
Start bp	53491
End bp	55044
Gene Length	1554 bp
Protein Length	517 aa
Translation table	11
GC content	40%
IMG OID	638103580
Product	autoinducer-2 (AI-2) kinase
Protein accession	YP_718255
Protein GI	113460198
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1070] Sugar (pentulose and hexulose) kinases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCATTAG ATGCCGGCAC AGGTAGTATT CGTGCAGTTA TTTTTGATCT TGAAGGAAAT 
CAAATCGCTA CGTCACAAAA AGAATGGACA CATATTTCCG ACCCAAATAT CCCAGGCTCA 
ATGGGCTTTG ATTTACAAAA TAACTGGCAC CTTGCTTGCT TATGTATTCA AGAAGTTTTA 
GCTACCAGCC AAATAGATGC TAAACAAATT ATAGCTATAT CGACTTGCTC TATGCGTGAA 
GGCATTGTTT TATACGATGC CAATAAAAAC CCGATTTGGG CGTGCGGTAA TGTGGATGCC 
AGATCTGTAG AAGAAGTTAT TCAATTAAAG TCTCTAAACC AGTATCAGTT TGAACAACAA 
GTTTATCAAT CCTCCGGTCA AACATTGGCA TTAAGTGCAT TACCCCGTTT ACTTTGGCTT 
GCACATCATC AACCTAATCT TTATGCTCAA GTCCATTTTC TCTCTATGAT TAGCGATTGG 
TTAGGATTTA TGCTTAGCGG AGAACTGGCC GTCGAACCTT CAAATGCTGG CACAACCGGC 
ATTCTCAACC TAAAAACCCG AAAATGGGAG CACACTTTAC TAGAGATGGC TGGACTCAAT 
CCTGCTATTT TACCGAAAGT AAAAGAGACA GGTGAAATAC TCGGTCAAGT AACCGCCCAT 
TCTGCACAGC AAACTGGGTT AATAGTCGGC ACGCCTGTTG TTGTTGGTGG TGGTGATGTG 
CAATTAGGTT GTATCGGACT AGGGATTACA GAACCGGGGC AAGCTGCTAT TATTGGAGGA 
ACTTTCTGGC AACAGGTCGT AAACTTACCA CAAGCAATGA CAGATCCTAA AATGAATATA 
CGCATCAATC CGCATGTCAT TGCACCGATG GTACAAGCAG AATCTATCAG CTTCTTTACA 
GGACTTACTA TGCGTTGGTT TAGAGATGCT TTCTGTGAAG AAGAAAAAGC CGTCGCTCAT 
CGCTTAGGTG TTGATGCTTA CACATTACTG GAACAAATGG CAGAAAAGAT ACCCGTAGGT 
TCAAATGATG TTATTCCTGT ATTCTCTGAT GCTATGCATT TCAAATCTTG GTATCACGCA 
GCCCCATCAT TTATTAACCT TTCGATTGAT CCTGAAAAAT GTAACAAATC AGTCCTGTTT 
AGGGCATTAC AAGAAAATGC AGCAATTGTA TCTTCATGTA ATCTTGATCA AGTCCAGCAA 
TTCAGCCACG TTAATCTTAC CAGTATTGTT TTTGCCGGAG GTGGTGCAAA AGGGAAATTA 
TGGAGCCAAA TTCTAGCTGA TGTAACAGGA TTGGTTGTTA ATGTACCTGT AGTAAAAGAA 
GCAACTGCTC TAGGATGTGC CATTGCAGCT GGAGTAGGTG CTGGTATTTA TACTTCATTA 
CATGAAGCAG GTAAAACATT AGTAAAATTT GAAAGACAAC ATCAACCAAA TGCAAGAAAT 
CATAATTTAT ATCAAATACA TAAAGAAAAA TGGCAAGAAA TATACCAGCA GCAATTGAAA 
TTGGTTGACA GAGGACTAAC CATTTCGCTT TGGAAAGCTC CTGGGATTAA ATAA

Protein sequence

MALDAGTGSI RAVIFDLEGN QIATSQKEWT HISDPNIPGS MGFDLQNNWH LACLCIQEVL 
ATSQIDAKQI IAISTCSMRE GIVLYDANKN PIWACGNVDA RSVEEVIQLK SLNQYQFEQQ 
VYQSSGQTLA LSALPRLLWL AHHQPNLYAQ VHFLSMISDW LGFMLSGELA VEPSNAGTTG 
ILNLKTRKWE HTLLEMAGLN PAILPKVKET GEILGQVTAH SAQQTGLIVG TPVVVGGGDV 
QLGCIGLGIT EPGQAAIIGG TFWQQVVNLP QAMTDPKMNI RINPHVIAPM VQAESISFFT 
GLTMRWFRDA FCEEEKAVAH RLGVDAYTLL EQMAEKIPVG SNDVIPVFSD AMHFKSWYHA 
APSFINLSID PEKCNKSVLF RALQENAAIV SSCNLDQVQQ FSHVNLTSIV FAGGGAKGKL 
WSQILADVTG LVVNVPVVKE ATALGCAIAA GVGAGIYTSL HEAGKTLVKF ERQHQPNARN 
HNLYQIHKEK WQEIYQQQLK LVDRGLTISL WKAPGIK