Gene Tpet_1534 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpet_1534
Symbol
ID	5170727
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermotoga petrophila RKU-1
Kingdom	Bacteria
Replicon accession	NC_009486
Strand	+
Start bp	1522251
End bp	1523543
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	52%
IMG OID	640564061
Product	extracellular solute-binding protein
Protein accession	YP_001245118
Protein GI	148270658
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000145285
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAAAAATC TTTTCAAGGG GGTGTTCAAG GTGAGAAAGT GGTTGTTTTT CATGGTTCTT 
CTGATCGTTG CGGGTCTCAT GTTCGGAAAG GTGAACTTCG CATCCACACA GATGACGCCC 
GCTGCTGAGA GGGAGTTCAT GCTCAACAAA CTCGTGGAAT TCTCGAAGAA GACCGGTATC 
GGTGTGGAGT TTCTCAACTT CGAGTATCCA CAGCTCTACA GCAGGCTCCA GGCGGAGATC 
AGAGCCGGTA AAAATACGCT GAACCTGATT GCAGACCTCC AGGGAAACCT CTACATAATG 
GCTTCCGAAG GATTTCTGAG CGATCTCAAG GATCTCAAAT TCGAAGGAAA AACCTTCATC 
GAGACGCTTG AGAAGTTCGC TTATGTGAAA GGTGAAAAGG TGTTCATTCC CTGGCTCCAG 
GCAACTTACG TGATGGCCGT TAACAAAAAG GCGTTTGACT ACCTGCCGCG CGGTCTTTCG 
AAAGAAGACG TCATCAGGGG GACGGAGAAG TGGACTTACG ACGCTCTGCT CGAGTGGGCA 
AAGAACATCT ATGAGAAGAC GAAACAACCC CTTCTTGGCT TCCCGATCGG ACCGAAGGGA 
CTCTGGCACA GGTTCCTCCA CGGCTACATC TATCCATCCT TCACGGGAGC GCAGGCTCTG 
AAGTTCGACA GTGTGAGGGC CGTTGAAATG TGGAACTATC TGAAGGAGCT CTTCAAATAC 
GTACATCCGG CAAGCTCCAC CTGGGACGGG ATGGCCGATC CTCTCCTGAG AGAAGAAGTC 
TGGATCGCCT GGGATCACAC TGCAAGACTC AAACCCGCGA TCGTTGAAAA GCCTAACGAT 
TTCGTTGTTG TACCGGTCCC AAGAGGGCCG ATGGGTAGAG GGTACATCAT AGTGCTTGTG 
GGTCTTGCCA TACCGAAGGG AGCGGATTTC GAGGAACCCG CGAAAGTGAT AGACTTCCTC 
ACTTCTCCGG AGATGCAGGT TGAAATCCTC AAGAACGTCG GTTTCTTCCC TGTGGTTCAG 
GAGGCTGTCG GTGCCGTGCC AGAAGGTGCC CTCAGGGTGC TCGCGGAAGG TGTGATAAAT 
CAGTCTGCCA CGAAGGACTC CGTCGTTTCC TTCATACCGA GTCTTGGATC AAAGAGCGGA 
GAGTTCACCG AAACCTACAG GATGGCCTTC ACGAGGATCG TCTTCCAAGG TGAAGACCCA 
GCGAAGGTAG TGAAGGAACT CGGTGAGCGA ATCAGACAGC TGTTCAAAGA ATCCGGAGCG 
GAACTTCCAG AACCCGACGC GAGCCTCTTC TGA

Protein sequence

MKNLFKGVFK VRKWLFFMVL LIVAGLMFGK VNFASTQMTP AAEREFMLNK LVEFSKKTGI 
GVEFLNFEYP QLYSRLQAEI RAGKNTLNLI ADLQGNLYIM ASEGFLSDLK DLKFEGKTFI 
ETLEKFAYVK GEKVFIPWLQ ATYVMAVNKK AFDYLPRGLS KEDVIRGTEK WTYDALLEWA 
KNIYEKTKQP LLGFPIGPKG LWHRFLHGYI YPSFTGAQAL KFDSVRAVEM WNYLKELFKY 
VHPASSTWDG MADPLLREEV WIAWDHTARL KPAIVEKPND FVVVPVPRGP MGRGYIIVLV 
GLAIPKGADF EEPAKVIDFL TSPEMQVEIL KNVGFFPVVQ EAVGAVPEGA LRVLAEGVIN 
QSATKDSVVS FIPSLGSKSG EFTETYRMAF TRIVFQGEDP AKVVKELGER IRQLFKESGA 
ELPEPDASLF