Gene Htur_4097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_4097
Symbol
ID	8744725
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013744
Strand	-
Start bp	359200
End bp	360555
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	60%
IMG OID	646514657
Product	Beta-fructofuranosidase
Protein accession	YP_003405604
Protein GI	284167326
COG category
COG ID
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTAGATA AGAGTACTAA TCTTGAGCTA AGCAGGCGCA GTATACTCAA AACAACTGGC 
GCAATTGGTG CGGCCGGTCT CGCGCTACCG TTTGGGACTG GCTCCGGAGC CGCTCTCGAG 
ACAGGTGAAG CGAGCCAGTG GACTCGCGAA CACGCAAACA GTATCGAACT TACAGACGAT 
ACGACTGCTC CGGTCATCGA TGAGAACTCC GACGTAATCT CGGACGACTA CTGGATCTGG 
GACACGTGGC CGCTTCGATA CCGCGACGGC TCGATTGCAA AGATCGACGG CTGGCAGGTC 
GTCTTCTCCC TCACGGCGTC AAAGGACCTC GTACCGGGCG CTCGGCACAA TGAAGCGACG 
ATTCGCTACT TCTACTCCCG GAATGGTCAC GACTGGCAGG AGGGCGGGAC GGCCTTCGAG 
AACCCGCTTG GGCACCACCA GTGGGCCGGC TCTGCGATGT ACGATCAGAG CGAGGACCAG 
ATTTACCACT TCTACACAGC GACCAGCCCG GAACCGGAGT TCCGCCAGCG ACTCGCACTC 
GGCAAGGGCG CGTCCCTCCG GACCAGTCCG CACGGCGTCG AGCTGACCGG TGACCAGGAG 
CACGTTATCA TCGGCGAAGC CGACGGGGAC CTCTATCAGA CCCTAGAGCA GTCCCGAGAA 
CAGGGCATCG TCTACGCGTT CCGTGACCCG TGGTACTTCG AGCATCCCGA GACCGGCGAG 
GATCTCGTCG TGTTCGAGGG GAACACGCCC ACGGGAGGCG ATAGCCCAGA TGATCCGCAA 
AGCTACAACG GGAACGTTGG CGTAATGCGA GCGACCAACG ACGAACTCAC TGAGTGGGAG 
CTCCTCCCGC CTAACCTGGA GGCGATCGAG GTCAACCAAC AGTTGGAACG CCCGCATTAC 
GTCTTCAATA ACGGGAAGTG GTATCTGTTC GTCCTCAGCC ACGAGTTTAC GTTCGCTCCC 
GGCCTCAGCG GTCCCGACGC GCTGTACGGG TTCGTGAGCG ATTCGCTCTA CGGAGAATAC 
GAACCGCTCA ACGGGAGCGG ACTGGTCCTC GCAAACCCCG AGTCGGCGCC CTTCCAAGCG 
TATTCGTGGC TGGCGATGCC CCACGGGAAC GACGTGCTGA TCGAAAGCTT CGAGAACTTC 
CGCGGGCTCG ACGACACGTC TCGGGGCGAG ATCAGCCTCG ACGAGGTCGG CCATCTGCCC 
CCCGAAGAGC AGAAGGAACT GTTCGGTGGA ACGCTTGCAC CGAGCCTGAA GCTACAACTC 
GAGGGGACTA AAACGCGGAT CGTCAGCGAA CTCAATGACG GCCACTTTCT TCCCTCGGGT 
GGATCGAACA AGGGGACGAA CGGAAATAAT CAGTAA

Protein sequence

MVDKSTNLEL SRRSILKTTG AIGAAGLALP FGTGSGAALE TGEASQWTRE HANSIELTDD 
TTAPVIDENS DVISDDYWIW DTWPLRYRDG SIAKIDGWQV VFSLTASKDL VPGARHNEAT 
IRYFYSRNGH DWQEGGTAFE NPLGHHQWAG SAMYDQSEDQ IYHFYTATSP EPEFRQRLAL 
GKGASLRTSP HGVELTGDQE HVIIGEADGD LYQTLEQSRE QGIVYAFRDP WYFEHPETGE 
DLVVFEGNTP TGGDSPDDPQ SYNGNVGVMR ATNDELTEWE LLPPNLEAIE VNQQLERPHY 
VFNNGKWYLF VLSHEFTFAP GLSGPDALYG FVSDSLYGEY EPLNGSGLVL ANPESAPFQA 
YSWLAMPHGN DVLIESFENF RGLDDTSRGE ISLDEVGHLP PEEQKELFGG TLAPSLKLQL 
EGTKTRIVSE LNDGHFLPSG GSNKGTNGNN Q