Gene Teth514_1099 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Teth514_1099
Symbol
ID	5876681
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermoanaerobacter sp. X514
Kingdom	Bacteria
Replicon accession	NC_010320
Strand	+
Start bp	1140141
End bp	1141514
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	38%
IMG OID	641541453
Product	extracellular solute-binding protein
Protein accession	YP_001662733
Protein GI	167039748
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGGTAAAA CAAAAAAGTA TCTTTCGTTG ATGGTAGTTA TTGTTTTTGC ACTCACGATA 
ATGTTGGCAG GGTGTGGAGG ACAAAAAACT TCCCAGTCAT CTGAAGGAGC TCCAGCGCCT 
CAAACAGAAA CTTCACAAAA GAAAGTAGAA GTTGTTTTCT GGCATAATAT GAAGGTAGTG 
ACTGATAGAC AGTCTATTGA AGAAGCAGTT CAAATGTTTA ACAAAGAACA TCCGAACATT 
GAAGTAAAAG CGGTATTAGT TCCAGGTGAC GAAACAGATG CAACGAAATT AATGACAGCT 
GTTGCAGCAG GGGAAGGACC TGACGTTTAT TATCTTGATA GATTTACAGT AGCACAAAGA 
GCTCATGCAG GCATGTTAGA ACCCTTAGAA GATTATCTAA CACAATTGGG TACAAATATT 
GATGACTTAA AGAGTAAATT TTTCGATTTT GCAATTGAAG AAGCAACTTA TAAAGGAAAA 
CTTTATGCAC TTCCGTGGGA TACTGATGCA CGTGTTTTAT ATTATAATAA AAAATTATTT 
AAAGAAGCAG GATTAGATCC GGAAAGACCA CCACAAACTA TATCAGAACT CGATGAATAT 
GCTAACAAAC TCACGAAAGT GCAAGGGGGA AAAATTTTGC AAATAGGTTT TATTCCTTGG 
CGTGGTCAAG GATGGCCTTA CACTTGGGGT TGGGTATTTG GAGGAAAATT TTATGATCAT 
GAAACCAAAA AATTTACTTT TGCAGATGAT CCTAAGATTG TTGCTTCACT AGAATGGCAG 
AAAACCTATG CTGATAAATA TGGAATAAAA AATATTGATT CTTTCTTTGC TGCTTTTGGG 
GATGGTGGAG GAGCAGAGCC TGTTGATCCA TTTATGATGG GAAAAGAAGC TATGAGGATA 
GATGGTAACT GGTTTTTGAG CACGCTGAGA AAATTTGCAG ATCCTAAAGT ATGTGAATGG 
GGAATAGCTC CAATACCATA TCCTGGAGGT AGGGAAAAAG ATTCAACTTG GGCAGGAGGT 
TGGAGTTTAG TTATTCCAAA AGGTGCAAAA CATCCAAAAG AAGCAGCTGA ATTTATTCAA 
TGGATGGCTA CAAAGGGTGC TATAAAATAT GCCAAAGATA CTGCTCATTT TTCTGCAATT 
AAAGAAGGTA CATTGGAGGT TGTAAAAGAA GATCCAGATC AAAAATTGTT TTATGAACTT 
TTAAATGGCC CCAATGCTCA CAGCCGCCCT GTTGTACCAG TAGGAGCACT TGTTTGGGAT 
GAGTTAGTAA GGGCTAGAGA TGACGCACTT TATGGTAAAA AAGTACCTCA ACAGGCTTTG 
AAAGAAGCAC AAGAGAAAGT TCAAAAAGAA CTTGATAAAG CTCTGAGTGA ATAA

Protein sequence

MGKTKKYLSL MVVIVFALTI MLAGCGGQKT SQSSEGAPAP QTETSQKKVE VVFWHNMKVV 
TDRQSIEEAV QMFNKEHPNI EVKAVLVPGD ETDATKLMTA VAAGEGPDVY YLDRFTVAQR 
AHAGMLEPLE DYLTQLGTNI DDLKSKFFDF AIEEATYKGK LYALPWDTDA RVLYYNKKLF 
KEAGLDPERP PQTISELDEY ANKLTKVQGG KILQIGFIPW RGQGWPYTWG WVFGGKFYDH 
ETKKFTFADD PKIVASLEWQ KTYADKYGIK NIDSFFAAFG DGGGAEPVDP FMMGKEAMRI 
DGNWFLSTLR KFADPKVCEW GIAPIPYPGG REKDSTWAGG WSLVIPKGAK HPKEAAEFIQ 
WMATKGAIKY AKDTAHFSAI KEGTLEVVKE DPDQKLFYEL LNGPNAHSRP VVPVGALVWD 
ELVRARDDAL YGKKVPQQAL KEAQEKVQKE LDKALSE