Gene HS_0586 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_0586
Symbol	xylF
ID	4240070
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	-
Start bp	623548
End bp	624549
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	37%
IMG OID	638104136
Product	D-xylose transporter subunit XylF
Protein accession	YP_718798
Protein GI	113460731
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4213] ABC-type xylose transport system, periplasmic component
TIGRFAM ID	[TIGR02634] D-xylose ABC transporter, substrate-binding protein

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACTTA AATCTAAGTT ATTAGCGGTC GCAACAGCAA CTTTAATGGT TTTTAGCCAT 
TCAGTGCTAG CAAACGATCT GAAAATCGGT ATGTCAATTG ATGATTTACG TTTAGAAAGA 
TGGCAAAAAG ACCGAGATAT TTTTGTGAAA AAAGCAGAAG CTTTAGGTGC AAAAGTATTC 
GTTCAATCTG CAAATGGTGA TGCGACAGCT CAAATTTCTC AAATTGAGAA TATGCTAAAT 
AAAGATATTG ATGTGCTAGT GATTATTCCA TTCAATGGCG AAGTATTGTC AAACGTGATC 
GCTGAAGCCA AAAAAGAGGG GGTTAAAGTT TTAGCTTATG ACCGTCTGAT CAATAACGCA 
GATATTGATT TCTATGTTTC GTTCGATAAT GAAAAAGTAG GTGAACTACA AGCACAAAGC 
ATTATTGAGA AAAAACCGAA AGGGAATTAT TTCTTAATGG GCGGTTCACC TGTTGATAAT 
AACGCAAAAT TATTTCGTAA AGGTCAAATG AAAGTATTAC AACCGCACAT TGACAGTGGT 
GAAATCAACG TGGTAGGCGA TCAATGGGTT GATTCTTGGC TAGCTGAAAA AGCATTACAA 
ATTATGGAAA ATGCGTTAAC TGCAAACAAA AACAATATTG ATGCGGTAGT CGCTTCTAAC 
GATGCAACTG CCGGTGGTGC AATTCAAGCA TTAAGTGCTC AAGGCTTATC AGGCAAAGTA 
GCGATTTCAG GTCAAGATGC TGATTTAGCG GCAATCAAAC GCATTCTTGA CGGTTCACAA 
ACAATGACCG TATACAAACC AATCACTAAT TTAGCAGATA AAGCAGCCGA AATTTCAGTC 
GCGTTAGGTA AAGGTGGAAA AGTGGAATCC AACTCTCAAT TAAATAACGG ATTGAAAAAT 
GTCCCTGCAT TCCTATTAGA GCCTGTCGTC GTTACAAAAG AGAATATTGA TGACACGGTG 
ATTAAAGATG GTTTCCATAC CAAAGAGGCT GTTTATAAAT AA

Protein sequence

MKLKSKLLAV ATATLMVFSH SVLANDLKIG MSIDDLRLER WQKDRDIFVK KAEALGAKVF 
VQSANGDATA QISQIENMLN KDIDVLVIIP FNGEVLSNVI AEAKKEGVKV LAYDRLINNA 
DIDFYVSFDN EKVGELQAQS IIEKKPKGNY FLMGGSPVDN NAKLFRKGQM KVLQPHIDSG 
EINVVGDQWV DSWLAEKALQ IMENALTANK NNIDAVVASN DATAGGAIQA LSAQGLSGKV 
AISGQDADLA AIKRILDGSQ TMTVYKPITN LADKAAEISV ALGKGGKVES NSQLNNGLKN 
VPAFLLEPVV VTKENIDDTV IKDGFHTKEA VYK