Gene HS_0054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_0054
Symbol
ID	4239562
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	59882
End bp	60901
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	40%
IMG OID	638103585
Product	ABC transporter, solute-binding, sugar transport
Protein accession	YP_718260
Protein GI	113460203
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.279397
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATACT CACTTTTAAA AACAACCGCT CTTGCCGTAG CGTTAGGTTT TACCGGTTTT 
AACATAGCAC AGGCTATGGA TAAGGTGGCA TTTATCCCAA AATTAGTTGG CGTTGGTTTT 
TTTACCAGTG GTGGGCAAGG TGCGGTCGAA ATGGGAAAAA AATTAGGTTT GGATGTAACC 
TATGACGGTC CGGCAGAACC GAGCGTATCG AACCAAGTTC AGATGATCAA TAACTTTGTG 
AACCAGGGTT ATAATGCCAT TATCGTCTCA GCAGTATCGC CTGATGGATT GTGCTCTACC 
TTAAAAAGAG CGATGAAAAA AGGTGTAAAA GTATTAACTT GGGACTCCGA TACTCAGCCT 
GAGTGCCGAA GCTACTATAT TAATCAAGGA ACACCTACTC AACTTGGCTC AATGCTAGTT 
GAAATGGTAT CAAGTCAAAT TTCTAAACCA AAAGCAAAAG TTGCATTTTT CTATTCCAGT 
CCAACAGTGA CTGACCAAAA CCAGTGGGTT AAAGAGGCAA AAGCAAAAAT TGAAAAAGAA 
CATCCCAAAT GGGAAATTGT GACGACACAA TTTGGCTATA ACGATGCAAT TAAATCACTG 
CAAACTGCCG AGGGGATCTT AAAAGCCTAT CCTGATTTAG ATGCGATTAT TGCTCCAGAT 
GCCAATGCTT TGCCGGCTGC CGCTCAAGCA GTTGAGAACC TTAAACGACA AGGTACAATC 
GTTGTCGGAT TCAGTACGCC GAATGTAATG CGTCCTTACG TAAAACGAGG CACAGTAAAT 
CAGTTTGGTT TATGGGATGT TGTGAAGCAA GGTCAACTCT CTGTTGCAGT AGCTAATGAA 
TTGTTAAAAG GTAATTCTCT TAAGGTTGGC GATAAATTGA ATGTTGATGG TATTGGTGAA 
GTAGAAGTAT CAGCAAATAA AGTACAAGGC TATGAGTTTG AAGCAAAGGG AAACGGTATT 
GTGTTACTAC CTGAGCGTGT TGTATTCACT AAAGATAATA TTGATAACTA TGATTTCTAA

Protein sequence

MKYSLLKTTA LAVALGFTGF NIAQAMDKVA FIPKLVGVGF FTSGGQGAVE MGKKLGLDVT 
YDGPAEPSVS NQVQMINNFV NQGYNAIIVS AVSPDGLCST LKRAMKKGVK VLTWDSDTQP 
ECRSYYINQG TPTQLGSMLV EMVSSQISKP KAKVAFFYSS PTVTDQNQWV KEAKAKIEKE 
HPKWEIVTTQ FGYNDAIKSL QTAEGILKAY PDLDAIIAPD ANALPAAAQA VENLKRQGTI 
VVGFSTPNVM RPYVKRGTVN QFGLWDVVKQ GQLSVAVANE LLKGNSLKVG DKLNVDGIGE 
VEVSANKVQG YEFEAKGNGI VLLPERVVFT KDNIDNYDF