Gene Tpet_0118 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpet_0118
Symbol
ID	5171235
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermotoga petrophila RKU-1
Kingdom	Bacteria
Replicon accession	NC_009486
Strand	-
Start bp	111909
End bp	113171
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	47%
IMG OID	640562619
Product	extracellular solute-binding protein
Protein accession	YP_001243723
Protein GI	148269263
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGAAGT TTTTGGTCAT TCTCATGGTA GTTCTTCTCG CAGTTCTGGC ACTGTCCAAA 
ACCAAGATAG TCTTCTGGAC CATGTCGTTG AAACCGACCT TCACAGATTT CATTCAGGGA 
ATCATCGACA GGTATGAAGA GTTGAACCCG GATGTTGAAA TCGTCTGGGA AGATGTTCCA 
TGGGACGTTC TCCAGCAGAA GCTTCTTGCG GCCTTCTCTT CTGGAAATCC ACCCGATGTT 
GTGAACCTGA ACGCTCAGTG GACCATCGAA TTCGCTCAGA AGAAAGTCCT GTTCCCCTTG 
AACGATTTGC TACCCGAAGA AGTTATCAAC CAGTACTTCG ACAACATGAT CAAAGGACTC 
ACTTGGAAAG ACGGAATTTA TGGAATTCCC TGGTACACAG CTGTGGACGT GATATTCTAC 
AACAAAGAGA TCTTCGAAAA AGCTGGACTG GATCCGAAGT ATCCACCTCG AACCTGGGAT 
GAAATACTCC TCTACTCAGT TTTGATCAAG GAAAAAACGG GAAAATACGG TGCTCTTCCT 
ACGATCTTCC AAGATCCCTC TGCGATCTTC AACTGGGACG GATTGAATCT CTACACGGTG 
GATGAAAACA ACAGAATAAA AGAAGTGCTC TTCGACAGAC CGGAATACGC TCACACTCTC 
AACAAATGGG CCACTCTCTA CAAACAGAAG TACATCCCGA GTGAAATCGT CCAGGGTGGA 
GAATGGACGA GAGCAACAGA ACTCTATCAG GCTGGAGAAC TCGCCATGTT GATCACTGGT 
GTTCAGTTCG CGGACAGAGT GAAATGGAAC GCTCCGGAAA TATACGAAAA ATCCGATGTT 
GCTCCTATTC CAGCTCCAAA ACCGGGTGTG AGAATGAGTG GATGGTACTC AACTCTGAAC 
GTAGTCAGAG GATCCAAGAA TCCTAAGGAA GCCGCTAAAT TCGCAGCGTT CGTTGCAAAC 
CTCGAGAACC AGATCGCATT CTGTAAGCTC GTGACCATAT TCCCGACTCT CAAAGCAGCG 
GTGAACGATC CGTGGTTCTC AAAAGACGAT GGAACGCTCG CTGCCAAAGC CAGGATCATG 
GGAGCCAAGT ATCTTGAGAA CATCACGTTC TACAACGATG ACATACCATT CAGAAAAGAA 
GCGTTCGACA GACTGAAGGA TGCCATTATT CAGGTGTTCC TTGGACAGAA AGATCCCGAA 
ACGGCGCTCA AAGAGACCGC GAAGTACTGG AGATATCTCA TTCAGACTCA GCAATCGAAA 
TAA

Protein sequence

MRKFLVILMV VLLAVLALSK TKIVFWTMSL KPTFTDFIQG IIDRYEELNP DVEIVWEDVP 
WDVLQQKLLA AFSSGNPPDV VNLNAQWTIE FAQKKVLFPL NDLLPEEVIN QYFDNMIKGL 
TWKDGIYGIP WYTAVDVIFY NKEIFEKAGL DPKYPPRTWD EILLYSVLIK EKTGKYGALP 
TIFQDPSAIF NWDGLNLYTV DENNRIKEVL FDRPEYAHTL NKWATLYKQK YIPSEIVQGG 
EWTRATELYQ AGELAMLITG VQFADRVKWN APEIYEKSDV APIPAPKPGV RMSGWYSTLN 
VVRGSKNPKE AAKFAAFVAN LENQIAFCKL VTIFPTLKAA VNDPWFSKDD GTLAAKARIM 
GAKYLENITF YNDDIPFRKE AFDRLKDAII QVFLGQKDPE TALKETAKYW RYLIQTQQSK