Gene Tpet_0639 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpet_0639
Symbol
ID	5171357
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermotoga petrophila RKU-1
Kingdom	Bacteria
Replicon accession	NC_009486
Strand	+
Start bp	643236
End bp	644663
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	47%
IMG OID	640563146
Product	glycoside hydrolase family protein
Protein accession	YP_001244235
Protein GI	148269775
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3507] Beta-xylosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000370471
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATCC TTTTGATGGC TACTTTGTTT CTTATCTTGC CGAGTGGTTG TCTTGTTTTA 
GGAATTGAGG ATAATATTCC AAGTTTCAGA TGGGCTACAG TCCACGATCC ATCTGTTATA 
AAAGCTGGCG ATACTTTCTA CGTTTTTGGC TCACACCTTC AAATTGCCAA ATCGAACGAT 
CTGATGCACT GGACACAGGT GAACGTAGGG GTTTATAACA ACAACCCCAT AATCCCAAAT 
ATATTCACCG AGCTGAAAGA AACTTTCGAA TGGGCTGAAA CAAACACTCT TTGGGCACCC 
CATGTGATTC AGCTTCAAGA TGGTAGGTAC TACTTCTACT ACTGTGCGTG CAGAGGAGAT 
TCGCCACGAT CAGCAATGGG GATCGCAGTC TCCGATAACA TCGAGGGCCC TTACAGAAAC 
CTCGGGATAA TTCTGCGATC TGGGTATCGC CCCGGAGAAG GAATGTGTGA AGAAGGAGTA 
CCATACGATG CGAGAATCCA TCCAAACGTT GTGGATCCAC ATGTTTTTTA CGACAAAGAA 
GGTAATCTTT GGATGGTTTA CGGGTCCTAC TCCGGTGGCA TTTACATACT AAAGCTCGAC 
CCAGAGACGG GTTTTCCTCT CCCAGGACAG GGGTACGGAA AGAAACTCAC AGGAGGAAAT 
CACAGCAGGA TCGAAGGTCC CTTTATCCTC TACAGTCCTG ATACAGATTA TTACTATCTC 
TTTCTGAGCT TTGGAGGGCT CGACTACAGG GGAGGATACA ACATCAGGGT TGCAAGGTCC 
AAAAACCCCG ACGGTCCTTA TTATGACGCA GAAGGTCGAA ACATGATAGA TTGTTACGGC 
CCGTCGTTCC TGGAAGGCAA CGATCCTTAC ATAGCACCTT TCGGTGTGAA ACTGGTGGGT 
AACTTCACCC TGAGCGAAGG AAACACCATA GACTTCCGAG TGTTCGGATA CGTATCTCCG 
GGGCACAACT CTGCCTATTA CGATCCAAAA ACTGGGAAGT ACTTCATCTT CTTCCACACG 
AGGTTCCCCG GCAGAGGAGA GACGTACCAG CTCAGGGTCC ATCAGCTCTT CCTCAACGAA 
GACGGATGGT TCGTCATGGC TCCTTTCCCA TATGCCGGTG AGACCATTGA AGATCTATCT 
TTTCAAGAGA TAGCAGGGGA ATATCAACTA TTAATACATG ATAAGGAAAT GACGAACGAG 
ATAAGGAAAC CCGTGAGAAT CGCTCTGAAT CCGGACGGAA CTGTCACTGG AGCTCAGACT 
GGTGAATGGG AGAAGAAGGG ACATTATATA ACTCTGAAAC TCGAAGGAGA GATCTACAAA 
GGAGTGACCT TGAAACAGTG GCACTATTCC GAGAAAAAGT GGGTGACAGT GTTTTCCGCT 
CTATCACAGA AGGGAGTTTC AGTGTGGGGT ATAAAAACTT CTGAGTAG

Protein sequence

MKILLMATLF LILPSGCLVL GIEDNIPSFR WATVHDPSVI KAGDTFYVFG SHLQIAKSND 
LMHWTQVNVG VYNNNPIIPN IFTELKETFE WAETNTLWAP HVIQLQDGRY YFYYCACRGD 
SPRSAMGIAV SDNIEGPYRN LGIILRSGYR PGEGMCEEGV PYDARIHPNV VDPHVFYDKE 
GNLWMVYGSY SGGIYILKLD PETGFPLPGQ GYGKKLTGGN HSRIEGPFIL YSPDTDYYYL 
FLSFGGLDYR GGYNIRVARS KNPDGPYYDA EGRNMIDCYG PSFLEGNDPY IAPFGVKLVG 
NFTLSEGNTI DFRVFGYVSP GHNSAYYDPK TGKYFIFFHT RFPGRGETYQ LRVHQLFLNE 
DGWFVMAPFP YAGETIEDLS FQEIAGEYQL LIHDKEMTNE IRKPVRIALN PDGTVTGAQT 
GEWEKKGHYI TLKLEGEIYK GVTLKQWHYS EKKWVTVFSA LSQKGVSVWG IKTSE