Gene Hore_19500 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_19500
Symbol
ID	7312765
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	2090139
End bp	2091173
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	43%
IMG OID	643612396
Product	D-xylose ABC transporter, periplasmic substrate-binding protein
Protein accession	YP_002509692
Protein GI	220932784
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4213] ABC-type xylose transport system, periplasmic component
TIGRFAM ID	[TIGR02634] D-xylose ABC transporter, substrate-binding protein

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	0.497232
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAA TATTTGCAAT TTTAACACTG GTAATGCTTT TCACAGGACT GGTTGTAACA 
GAGGCACTGG CTGATGATGA ATTGGTAATC GGTCTTTCAA TGGACAACCT GAGGCTGGAG 
AGATGGCAGC ATGACCGTGA CATCTTTGTT AAAAGGGCTG AAGAATTAGG TGCAAAAGTA 
TTGGTACAGT CTGCCAATAG TGATGATATG GTGCAGTTAT CCCAGGCTGA AAACCTGATT 
ACCCAGGGCA TCGACGTACT GGTAGTTGTG CCCCACAATG GTAAAATTAT GGGCAGTATT 
GTCAGGGAAG CTCACCGTAA TGGAGTTAAG GTCCTGGCTT ATGATAGATT GTTAATGGAC 
TGTGATGTTG ACCATTATAT TTCTTTCGAT AATATCCGGG TTGGAGAGTT ACAGGCCCAA 
TACCTGGTTG ACAGGAAACC AAGTGGGAAG TACTTTCTTT TAGGTGGTTC TCCTACCGAC 
AATAACGCTA AACTCTTCAG GCAGGGACAG ATGAATGTAC TTAACCCCTA TATTGAAAGG 
GGAGATATTG AGGTAGTAGG TGATCAGTGG GCCAAGGACT GGTTACCTCA GGAAGCCATG 
AAGATAATTG AGAATGCCCT GACTGCAAAC AACAATGATA TTGATGTAAT TGTTGCTTCC 
AATGATAGTA CTGCCGGTGG AGCTATTGAA GCCCTGGCAG AGCAGAACCT TGACGGAAAG 
GTGCTGGTAT CTGGTCAGGA TGCCGACCTG GCTGCCTGTC AGCGTGTTGT TGAAGGTACT 
CAGACCATGA CCATTTATAA ACCAATTAGT AAGCTGGCTA ACAGGGCAGC TGAAGTCGCA 
GTAGCCATGG CTAAAGGGGA AGAAGTTAAA ACAAATGGTA AGGTAAATAA TGGCAAGATC 
GATGTTCCTT CCATTCTGCT GGAGCCAATT GCAGTCGATA AAGATAATAT GGTTGAAACA 
ATTATCAAAG ATGGTTTCCA TAGTTTAGAA GACGTATATA AAAATGTACC CAGGGAAGAA 
TGGCCTGAAC TATAA

Protein sequence

MKKIFAILTL VMLFTGLVVT EALADDELVI GLSMDNLRLE RWQHDRDIFV KRAEELGAKV 
LVQSANSDDM VQLSQAENLI TQGIDVLVVV PHNGKIMGSI VREAHRNGVK VLAYDRLLMD 
CDVDHYISFD NIRVGELQAQ YLVDRKPSGK YFLLGGSPTD NNAKLFRQGQ MNVLNPYIER 
GDIEVVGDQW AKDWLPQEAM KIIENALTAN NNDIDVIVAS NDSTAGGAIE ALAEQNLDGK 
VLVSGQDADL AACQRVVEGT QTMTIYKPIS KLANRAAEVA VAMAKGEEVK TNGKVNNGKI 
DVPSILLEPI AVDKDNMVET IIKDGFHSLE DVYKNVPREE WPEL