Gene Tpet_0119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpet_0119
Symbol
ID	5171269
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermotoga petrophila RKU-1
Kingdom	Bacteria
Replicon accession	NC_009486
Strand	-
Start bp	113168
End bp	114571
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	46%
IMG OID	640562620
Product	glycoside hydrolase family 3 protein
Protein accession	YP_001243724
Protein GI	148269264
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGACGTGG ATCTTGGAAA GCTGTTCTTC TGCGGTTTCA ACGACTTCAA CGAAGAAGTC 
AAGGAAATAA TCAGAAAATA CAGACCGGCC GGTATTTTGA TCTATCCAGG AGTTCTTTCG 
AAAGAGTACC TTCTAATGGA TTTCATGAGT TTTCTATCGA AGGAAGGAGA TTTTCTCGTC 
AGTTCCGATC ACGAGGGTGG CCAGCTTGAG GTGTTGAAAT ACGTTCCCTC GTCTCCGGGA 
AATCTTGCCT TTGGGAAAAA CTCACCAGAT GTGACTTACA GATATTCCAA GATCGCAGGA 
AAGATCATGG AGATTGTGGG GTTCAACATG GTTTTTGCTC CTGTTCTGGA TCTTCTTTCT 
GAGGAAAGCT CTTCGGTGAT CGACATGAGA AGCTACGGCT CAGATCCCAA AATCGTAGCC 
GAGCACGGGG CAAAAGCCTG TGAAGGTTAT CTGGAAGGTG GAGTTATGCC CTGCATCAAG 
CACTTTCCAG GTCACGGAAG AGCAAGAGAA GACTCTCACC TCACCCTTCC TGTGGTCGAT 
GCACCCTTTG AAAAACTCTG GGAAGAGGAT CTTCTGCCGT TCAGAAAGGT GCTGGAAAGG 
GAGAAAAAGG TCACGGTCAT GACGGCCCAC GTCAGATACT CTTCGATAGA CAGTCTCCCG 
GCTACTCTTT CGGAGAAGAT CATAACGGAC GTTCTCAGAA AAAAGATCGG TTTCGACGGT 
CTTGTGATCA GTGACGCTAT GGAAATGAGC GCTGTGTCGA ACAATTTCTC TGTTGAAGAG 
ATTGTGAGTC TCTTTCTGAA CGCGGGAGGA AACATGATCC TTCTCGGTGA TTACAGAAAT 
CTTCCGGTTT ACTATGAAAC GCTGGTGAAA CTCCTCGAGG ATGGAAAGGT CCAGAAGGAC 
AAAGTGGAGC GCTCCATAAG GATGGTGGAA AAATATCTTG CTTTTGCGAA GAAAAACAGC 
GGTGTTGGTT TCCTCGCCGA TTCTTCGGCA AAGGCTGTGG AATTCCTCGG TTTTGAAAAG 
ATAGATCATA CCAGTGAAGT GACTCTTCTC GTTCCTTCCA GTGAGAATCT GAGTCAGGCA 
GACACCACGG GGGGCGATTA CGATCAGATT CCAGAGATCG TTTCCAGATT TTTCGAAGTC 
GAGAATGTTG TTCGATACAC CGTAGAAGAC GGTCCCGAGT TCGTTGAAGG TGATTTGATC 
TTCGATTTTG TAGCCGACAT ACCGAACGAA AAGGCTTTGA AAGCCCATCT GAGCCTTCCG 
GCAGAAAAGA CCGTTTACTT CGTTCTGAGA AATCCGTTCG ATGTCAGGTA TTTCGAGGGA 
AGAAAGATAG TCGTCACAAG ATCGACGAAA CCCATTTCTA TCTATAAATC CTTAGAACAT 
TTTTTAGGGA GGTGTGATTC ATGA

Protein sequence

MDVDLGKLFF CGFNDFNEEV KEIIRKYRPA GILIYPGVLS KEYLLMDFMS FLSKEGDFLV 
SSDHEGGQLE VLKYVPSSPG NLAFGKNSPD VTYRYSKIAG KIMEIVGFNM VFAPVLDLLS 
EESSSVIDMR SYGSDPKIVA EHGAKACEGY LEGGVMPCIK HFPGHGRARE DSHLTLPVVD 
APFEKLWEED LLPFRKVLER EKKVTVMTAH VRYSSIDSLP ATLSEKIITD VLRKKIGFDG 
LVISDAMEMS AVSNNFSVEE IVSLFLNAGG NMILLGDYRN LPVYYETLVK LLEDGKVQKD 
KVERSIRMVE KYLAFAKKNS GVGFLADSSA KAVEFLGFEK IDHTSEVTLL VPSSENLSQA 
DTTGGDYDQI PEIVSRFFEV ENVVRYTVED GPEFVEGDLI FDFVADIPNE KALKAHLSLP 
AEKTVYFVLR NPFDVRYFEG RKIVVTRSTK PISIYKSLEH FLGRCDS