Gene HS_1601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_1601
Symbol	uidB
ID	4241128
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	1817191
End bp	1818606
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	36%
IMG OID	638105187
Product	glucuronide permease
Protein accession	YP_719806
Protein GI	113461737
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2211] Na+/melibiose symporter and related transporters
TIGRFAM ID	[TIGR00792] sugar (Glycoside-Pentoside-Hexuronide) transporter

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTCAA CACAAAGACC TTTTGGTTTA AAAGACAAAC TTGCCTATAT GGCTGGCGAT 
ATTGCTAATG ATCTCAGTTT TATGATGTCC GCCTTCTTTT TAATGCTATT TTATACTAAT 
GTGCTACAAA TTGAAGGTTA TGTTGTCGGT CTTCTATTTC TAGTTTCTAG ATTTATTGAC 
GCTTTTACTG ATATTGGTAT GGGACGTTTA GTAGATACTA TAAAGCCTTT TAAAGAGGGG 
CGTTTCAGAG GTCTTATTCG CCGGGCAACT CCCTTTATCT GTATTTCAGG ATTTCTGCTT 
TTCTTGCACA TTGTGAAAGA TTGGTCTTAT ACCGCAAAAT TGGTCTACAT CACTGTTACC 
TACATAGTTT GGGGTAGTTT AGCCTATACT GCGGTCAATA TTCCTTATGG TTCAATGGCT 
TCCGTGATTA CTACAAAAGC TGATGAGCGT GCCGGATTAT CTATCTTCCG TACAGTGGGT 
GCAAATATTG CGGTACTTTT TATCTCATTT GTTATTCCAC TCATTATTTA CAAAGAAGTT 
GAAGGTAAAC AAGTAATTAT CCCAGAAATG TTCACATACA TTATGGGAGC ATTTATGATC 
TGTGCGTTTA TTTTGTACCA AATCTGTTGG AGATTTTCGG TTGAGCGAGT TCAATTGCCT 
GAACAAGAAG GTCGTCGCCA CAACAAATCA CACAATAAAT CAGACTGTTT AGATGACGTA 
AAAGCAATCT TTAGCAGTCT ATTCTCAAAC AGTGCATTAC TTATCTTTAT TTTAATCGCT 
ATCATTTTAC TGCTAGCAAC CTTAATCATC GGTACAATGA ACCCATATTT GTATGTTGAT 
TACTTTAATA GTAAATTAGC ATTGTCATTT GGTGGTATTT TAGGCGCCGT GACAACATTT 
ATGGTTGCTC CGTTTGCCCA AAATATTGTG AAAAAGTACG GTAAAAAAGA ATCAGCTTCT 
GTAGGTTTAT TGATAACTGC TGTCATATAC AGTGTGCTAT TCTTCGTTAA AATCACAAAT 
GTTTGGTTAT TTATCATTGT TGCACTCATT GCAACACTGG GTCTAAGTTA TTTCCAAATT 
ATTATATGGG CATTTATTAC AGATATTATT GATAACCAAT TTATCAAAAC TGGACGCCGT 
GAAGATGGCA CAATTTATGC AGTTTATTCA TTTGCTCGCA AAATCGGTCA AGCTTTAGCT 
GGTGGTTTAG GTGGCTTTGC ACTAAGTTAC ATTGGCTATT CTGCAAAAAT CCCACAACAA 
CCACAAGAAG TGTTAGAGTC AATCTATAAC TTTGCAACGG GAGTACCTGC ATTGGCTTGC 
ATCTTGATTT TTTTACTGTT GAAATACGTT TACCCGCTTT CTAAAGAAAA AGTGGACGAA 
AACGCAAGTA TATTAGAACA AAAAATAACT CAATAA

Protein sequence

MSSTQRPFGL KDKLAYMAGD IANDLSFMMS AFFLMLFYTN VLQIEGYVVG LLFLVSRFID 
AFTDIGMGRL VDTIKPFKEG RFRGLIRRAT PFICISGFLL FLHIVKDWSY TAKLVYITVT 
YIVWGSLAYT AVNIPYGSMA SVITTKADER AGLSIFRTVG ANIAVLFISF VIPLIIYKEV 
EGKQVIIPEM FTYIMGAFMI CAFILYQICW RFSVERVQLP EQEGRRHNKS HNKSDCLDDV 
KAIFSSLFSN SALLIFILIA IILLLATLII GTMNPYLYVD YFNSKLALSF GGILGAVTTF 
MVAPFAQNIV KKYGKKESAS VGLLITAVIY SVLFFVKITN VWLFIIVALI ATLGLSYFQI 
IIWAFITDII DNQFIKTGRR EDGTIYAVYS FARKIGQALA GGLGGFALSY IGYSAKIPQQ 
PQEVLESIYN FATGVPALAC ILIFLLLKYV YPLSKEKVDE NASILEQKIT Q