Gene HS_0031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_0031
Symbol
ID	4239539
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	32278
End bp	33753
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	35%
IMG OID	638103562
Product	sugar ABC transporter, ATP-binding
Protein accession	YP_718237
Protein GI	113460180
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1129] ABC-type sugar transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAATA TCAATAAGAC ATTCCACGGT GTAAAAGCCT TAAATCGAGT TAACCTCTCT 
TTAGATTATG GAGAAGCTCT CTGCCTTGCC GGTCAAAACG GTTGTGGAAA ATCCACGCTA 
ATCAAAATCC TCTCAGGTGT TTATCAACCA GATAAAGGGG CTGAAATTCA AATTGGTGCG 
AGCAAATATA CCAAACTGAC GCCACAAGCT TCTATTGAAC AGGGAATTCA AGTAATCTAT 
CAAGATTTAG CCCTTTTTCC TAATTTAACT GTCGCTGAAA ATATTGCAAT AAATTTACAT 
CGAAAATTAG GTTGGGTCAG CCAATCAGAA ATTCATCAAG TTGCATTAAA CGCAATACTA 
AGCATTAATG CAGATTTAGA TCTCAATGCT ATTTTAGAAG ATTTACCAAT TGCACAGCAA 
CAATTAGTCG CTATTTGTAG AGCGCTTGCA CAAAATGCTC GACTGTTAAT TATGGATGAG 
CCAACAGCAT CTCTTACTGC GAAAGAAGTA CAAGATCTGC TAAAAGTTGT ACTCAAGTTA 
AAAAGTAAAG GCATTAGTAT TATTTTTGTC AGTCATAAAT TACAAGAAGT AATGAGTGTC 
TCTGATACCG TTTTAGTACT TAAAAATGGG AATATGGTTG GACAATACCC TATTAGTGAA 
ATGGATGAAA AACGCTTAGG ATTCTTAATG ACAGGCTTGG AAATTGACTA TAAACGGTTA 
GATTTGCCCG ATTTTTCGCA AAATAGAACC GTTTTAGAAG TTCAAAATTT AACTCTGCCT 
AACCAGTATG AATCCATTAA TTTCTCATTA AGAGAAGGAG AAATTATTGC CTTGACCGGT 
TTACTCGGCT CAGGTCGGAC GGAACTGTGC CTTAGCTTAT TTGGAATCAC TCAACCTAAA 
TCAGGTGATA TACTATTAAA TGGTGAGAAG GTTATATTTC AAAACAACCG TGATGCTATC 
AAACAAGGAA TTGCTTATGT TTCTGAAGAT AGAATGACAA CTGGTTTAAT TATGACTGAA 
TCCATACATC ATAATATTAT CTCTACTATT TTTCATAAAA TCACCGATAA ATTTAACATT 
ATAAAATCAT CAAAAGCCTA TAATTATAGC CAGGAATTAA TTGAATCTTT AAAAATTAAA 
GTAACGGATT CAGATTTGCC AGTAAATACA CTTTCCGGTG GGAATGCCCA GCGGGTGTCT 
ATCGCAAAAT GGTTAGCAAT AGATCCTAGA ATTATTATTT TAGATGCTCC AACCATTGGG 
GTAGATATTG CGAATAAGGA AGGAATATTC CAAATTATTC GCACATTAGC ACAAAAAGGT 
ATCGCTGTTA TTTTTGTGAC CGATGAGGTA GAAGAAGCAT ACTACAACAG TCACAAAGTC 
ATAGTAATGA AAAAAGGTAA AATTGTAGGT GAGATATTAC CTATCTATAC CACAGAAAAA 
TCAATTGCGG AGGTTGTTTA TGAAAATCAC CAATAA

Protein sequence

MQNINKTFHG VKALNRVNLS LDYGEALCLA GQNGCGKSTL IKILSGVYQP DKGAEIQIGA 
SKYTKLTPQA SIEQGIQVIY QDLALFPNLT VAENIAINLH RKLGWVSQSE IHQVALNAIL 
SINADLDLNA ILEDLPIAQQ QLVAICRALA QNARLLIMDE PTASLTAKEV QDLLKVVLKL 
KSKGISIIFV SHKLQEVMSV SDTVLVLKNG NMVGQYPISE MDEKRLGFLM TGLEIDYKRL 
DLPDFSQNRT VLEVQNLTLP NQYESINFSL REGEIIALTG LLGSGRTELC LSLFGITQPK 
SGDILLNGEK VIFQNNRDAI KQGIAYVSED RMTTGLIMTE SIHHNIISTI FHKITDKFNI 
IKSSKAYNYS QELIESLKIK VTDSDLPVNT LSGGNAQRVS IAKWLAIDPR IIILDAPTIG 
VDIANKEGIF QIIRTLAQKG IAVIFVTDEV EEAYYNSHKV IVMKKGKIVG EILPIYTTEK 
SIAEVVYENH Q