Gene Tpet_1689 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpet_1689
Symbol
ID	5170787
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermotoga petrophila RKU-1
Kingdom	Bacteria
Replicon accession	NC_009486
Strand	+
Start bp	1690094
End bp	1691785
Gene Length	1692 bp
Protein Length	563 aa
Translation table	11
GC content	48%
IMG OID	640564215
Product	Beta-glucuronidase
Protein accession	YP_001245270
Protein GI	148270810
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3250] Beta-galactosidase/beta-glucuronidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0566843
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAAAAC CAAAGAACAC TCTTAAGAGA ATCGTACAAA ACCTGGATGG CTTCTGGGAT 
TGTGAGATAA AAGAAGAGAA CAGACCCATA GCCGTTCCTG GAAGCTGGAA CGAGCAGTAC 
CAGGATCTGT GCTACGAAGA AGGACCCTTC ACCTACAAAA CCACCTTCTA CGTTCCAGAG 
GAACTTTCAC AAAAACACAT CAGACTTTAC TTTGCTGCCG TGAACACAGA CTGCGATGTC 
TTCCTAAACG GAGAGAAAGT GGGAGAGAAT CACATTGGAT ACCTTCCCTT CGAAGTAGAT 
GTGACAGGGA AAGTGAAACC AGGAGAGAAC GAATTCAAGG TGGTTGTTGA GAACAGGTTG 
AAGGTGGGAG GATTTCCCTC GAAGGTTCCA GACAGAGGCA CTCACACTGT GGGATTCTTC 
GGAAGTTTTC CACCTGCAAA CTTCGACTTC TTTCCCTACG GAGGAATCAT AAGACCTGTT 
CTGATAGAAT TCACAGACCA CGCGAGGATA CTCGACATCT GGGTGGACAC GAGTGAATCC 
GAACCGGAGA AGAAACTTGG AAGAGTGAAA GTGAAGGTAG AAGTCTCAGA GGAAGCGCTG 
GGACAGGAGA TGACGATCAA ACTTGGAGAA GCTGAGAAAA AGATCAAAAC ATTCGACAGG 
TTCGTTGAAG AAGAGTTCAT CCTCGAAAAC GCCAGATTTT GGAGCCTCGA AGATCCGTAT 
CTTTATCCTC TAAAAGTGGA ACTCGAAAGG GACGAGTACA CTCTGGACAT CGGAATCAGA 
ACGATCAGCT GGGACGAGAA AAAGCTCTAC CTGAACGGAA AACCCGTCTT TTTGAAAGGC 
TTTGGAAAAC ACGAAGAATT TCCCGTTCTG GGACAGGGCA CTTTCTATCC TCTGATGATA 
AAAGACTTCA ACCTTCTGAA GTGGATCAAC GCGAATTCCT TCAGGACCTC TCACTACCCT 
TACAGTGAAG AGTGGCTGGA TCTTGCCGAC AGGCTGGGAA TCCTTGTGAT AGACGAAGCC 
CCGCACGTTG GTATCACAAG GTACCACTAC AACCCCGAGA CTCAGAAGAT AGCCGAAGAC 
AACATAAGAA GGATGATCGA CAGAGACAAA AACCATCCCA GTGTGATCAT GTGGAGTGTA 
GCGAACGAAC CAGAATCCAA CCATCCAGAC GCGGAGGGTT TCTTCAAAGC CCTTTACGAG 
ACCGCCAAAG AAATGGATCG AACACGTCCT GTGGTCATGG TGAGCATGAT GGACACGCCA 
GACGAAAGAA CAAGAGATGT GGCACTGAAG TACTTCGACA TCGTCTGTGT GAACAGGTAC 
TACGGCTGGT ACATCTATCA GGGAAGGATA GAAGAAGGAC TTCAGGCTCT GGAAAAAGAC 
ATAGAAGAAC TCTACGCAAG ACACAGAAAG CCCATCTTTG TCACGGAGTT CGGTGCAGAC 
GCGATAGCCG GTATCCACTA CGACCCACCT CAGATGTTCT CCGAGGAGTA CCAGGCAGAG 
CTCGTTGAAA AGACGATCAG GCTTCTTTTG AAAAAAGACT TCGTCATTGG AACACACGTG 
TGGGCCTTCG CGGACTTCAA AACCCCTCAA AATGTGAGAA GGCCCATCCT CAACTACAAG 
GGTGTCTTCA CAAGAGACAG ACAACCCAAA CTCGTTGCTC ATGTGCTGAG AAAACTGTGG 
AGTGAGGTTT GA

Protein sequence

MLKPKNTLKR IVQNLDGFWD CEIKEENRPI AVPGSWNEQY QDLCYEEGPF TYKTTFYVPE 
ELSQKHIRLY FAAVNTDCDV FLNGEKVGEN HIGYLPFEVD VTGKVKPGEN EFKVVVENRL 
KVGGFPSKVP DRGTHTVGFF GSFPPANFDF FPYGGIIRPV LIEFTDHARI LDIWVDTSES 
EPEKKLGRVK VKVEVSEEAL GQEMTIKLGE AEKKIKTFDR FVEEEFILEN ARFWSLEDPY 
LYPLKVELER DEYTLDIGIR TISWDEKKLY LNGKPVFLKG FGKHEEFPVL GQGTFYPLMI 
KDFNLLKWIN ANSFRTSHYP YSEEWLDLAD RLGILVIDEA PHVGITRYHY NPETQKIAED 
NIRRMIDRDK NHPSVIMWSV ANEPESNHPD AEGFFKALYE TAKEMDRTRP VVMVSMMDTP 
DERTRDVALK YFDIVCVNRY YGWYIYQGRI EEGLQALEKD IEELYARHRK PIFVTEFGAD 
AIAGIHYDPP QMFSEEYQAE LVEKTIRLLL KKDFVIGTHV WAFADFKTPQ NVRRPILNYK 
GVFTRDRQPK LVAHVLRKLW SEV