Gene Tpet_0636 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpet_0636
Symbol
ID	5170374
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermotoga petrophila RKU-1
Kingdom	Bacteria
Replicon accession	NC_009486
Strand	-
Start bp	639529
End bp	640776
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	43%
IMG OID	640563143
Product	extracellular solute-binding protein
Protein accession	YP_001244232
Protein GI	148269772
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000210277
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGAAGT TACTGGTATT TCTGGTAGTT CTTGTTTTAG CTCTTCCACT CATAGCCAAG 
ATTCAAATTA CGTTCATGAC GCCACTCTCC GGTGCTGATG GAGCGTATAT GGATCAGATC 
ATTCAGAAGT TCAACGAAAC ACATCCTGAT ATTGAGATTG TTCATCTTGT CGTAGGAAGT 
TCTCTGGAAT ACAAACAAAA GCTTGCCACA GGTATTTCCA CGAAATCTGC TCCCCAGGTT 
CTGTTTATTA GAAAACATGA CATGCCGCTG TTTCTTGATC ACTTCAGAAC CTTCACAAAA 
GAAGAACTCC AACAGTGGGG TATCGATATC GATGATATTT ATCCCTCTGT CCTTGAAGGA 
CTTGTAACAA AAGACGGTAA GTATTATGGA ATACCAATTG ACGTCTGGAT TTTCTACATG 
GCTTACAGGA AAGACAATTT CAAAAAAGCT GGTCTTGATC CAGACCTTCC ATTGAAGGAA 
GGGCCACTCA ACAGCGAACA GTTTGTAAAC GTTCTGAGAG CTCTCAGAAA AGTCACACCA 
GAAGGTTCAT TCCCATGGTG TGAGTCTCCA AGCTGGGATT GGGAATTTGT ACATTTGCTG 
TGGCAGTTTG GTGGAGATAT TCTGACACCT GACTTCAAGC GTCCTGCATT CAAAGAAGCT 
GGTATAAAAG TTCTCAAATT CCTCCAGGAA CTTCAAAAAG AAGGATTGTA TCCTGATCAA 
CCTATCGATG CAGGGCCAAC CTTTGAGTCT GGAGCAGGTT CTATCTTGAT AACAGGTATC 
TGGACAATCA ATCCATGGCT TGATCTGCTT GGAAATGACT TTGGTTACGC ACCAGCTCCT 
CAGCTTGGAA CAACAAAATC CGTGTTTGGT GGTTCACATG TGATCGCAAT TCCAAAGGTC 
ATGGTGGAAG ATGAAAAGAC CTTCAACGCC GTGATGACTT GGGTTAAGTA TCTGTGGGAT 
CACGCAATCG AATGGTATGC GGCTGGTCAG ACACCCGCCA GGAAATCCAT AGCTGAGAGC 
GAAGAATTTA AAGAAAAGTT CCCACATCTG TACGTCGCTG CTCAACAGGT ATCTTATGTT 
AAAACCTTCC AGATGTTCCC GTACATAGCT GAGATCCTTG CCGAGATAGT GCCATACATT 
GAAGAAGTGC TTATCAATAA GAGCATGACG CCTGAGGAAG CAATGGAGGA AGCCGAAATG 
GTTGCTCAGG AAATAATTGA TGATTACTGG GCAACAGTTG GAGAATGA

Protein sequence

MRKLLVFLVV LVLALPLIAK IQITFMTPLS GADGAYMDQI IQKFNETHPD IEIVHLVVGS 
SLEYKQKLAT GISTKSAPQV LFIRKHDMPL FLDHFRTFTK EELQQWGIDI DDIYPSVLEG 
LVTKDGKYYG IPIDVWIFYM AYRKDNFKKA GLDPDLPLKE GPLNSEQFVN VLRALRKVTP 
EGSFPWCESP SWDWEFVHLL WQFGGDILTP DFKRPAFKEA GIKVLKFLQE LQKEGLYPDQ 
PIDAGPTFES GAGSILITGI WTINPWLDLL GNDFGYAPAP QLGTTKSVFG GSHVIAIPKV 
MVEDEKTFNA VMTWVKYLWD HAIEWYAAGQ TPARKSIAES EEFKEKFPHL YVAAQQVSYV 
KTFQMFPYIA EILAEIVPYI EEVLINKSMT PEEAMEEAEM VAQEIIDDYW ATVGE