Gene Htur_5018 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_5018
Symbol
ID	8745824
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013748
Strand	+
Start bp	8968
End bp	10521
Gene Length	1554 bp
Protein Length	517 aa
Translation table	11
GC content	66%
IMG OID	646515632
Product	peptidase S8 and S53 subtilisin kexin sedolisin
Protein accession	YP_003406579
Protein GI	284176303
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	0.317126
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCAGGA GAGACTTTCT GACGACGGCA GGAGCAACGG CAGGCACACT CTCGACCCCA 
GCGTTCGTCG GCCCGTTCGA CGGCCGGATC GGCTCGAGTG ACACACTCAC ACTGGCTGCG 
CTCGACGCGG AGAACATCAA GACGTTCGGC GATTTGAACC CGTCGTTCGT GTTCTTCTAC 
AGCGACGACA GCGCCCGATC ATCGTTGCAG TCGTGGGTCG ACTCGAGCGA CGACCGCGTA 
CTCAAACGCG ACCATCCGAC GGTCGGTATG ATGACGATCT CGATGCCCTG GTCGGAGGTC 
GGCCTCAAGC AGTACTCCGC TGGCGTCGGA GACTACGATG TCGGCCTCGA GCGCATCGAC 
GGCGGTGCGC AAGCCCTCGA GTACGTCGAT ACGATCGACG CGAACATGGT CATGTCCCGA 
CCGGAACCGC TCGAGGAACT CGAGGGGACC GGCGTGGCCT CTCTTGACCT CGGATTCCGC 
GAGAAGGTCT CGATGCTCGC CGAAACGGGG GCGTGGAATC CCACGCCCGA GACGGCCGGA 
CTCGCGTTCG ACGAGGACGC GCCGGAAGCG ACACTGTCCG AGTCACGCGC TCACGTGCGC 
GCGGACGATA CCGTTCTCTC GGGTGTCGAC ACCTCGAGCC TGACCGTCGC CGTCATCGAC 
ACCGGTGTCA ACACGGGGCT CAACCTCGAC GAAAGCCGCC TCCACGGCGA GTCGACAGGC 
TACGCGAAGG ATGGCGACCC GACATACAGC GAGGAGGGCA CCGACGCGAT CACCGACGGC 
GACGGACACG GAACGTGGGT CGCCCACTGT ATCGCGGGTT CGAACGGCTT CGCTCCCGAT 
GCGACCGTAC TGGGGCTCAA GGTGCTGGGC GACGACGGGA GCGGCGACAC GAAAGACATC 
ATCGCCGGCA TCGAGAAGGC GATCGACGTC GGCGCCGACG TCGCCTGCCT CTCCCTTGGC 
AGCCCGCAGT GGTCCGAGTC GCTTGCGGCG GCGCTCAACG ACGCTCGAGA GGCCGGTGTG 
TTCTGTGCGG TGGCAGTGGG CAATGATCGC TATGGAACCG TGTGGGTCGC CAGCCCGGCA 
GACGCTGACG GCGGCTTCGG CGTCCAGGCG TGTAACGTCC CCGAGTCGGG CGACCGCGAC 
GATACGGAAC TCGCGTACTT CGGGAACACC GGACCGGACC CCGGCAGCAC CGACCTCTCC 
GGTGGCGACT CGGAGGGTGC GGTTCCACTG CTGGCCGCGC CGGGGATGTC GATTACAATC 
GAACTCCCCA GTGGCCTGAG CACGCTCTCG GGAACCTCGA TGGCCGCACC CCACGTGGCT 
GGCGGCGCGG CCGTTTCCCG AGCAGCGGGC TACGGCGTCG ACGAGACGTG GTCGCGACTC 
ATCAAGTACG CTTACCCGCT CCCGAACGCG GGCGCAACCG AGGCGAAACA CGGTCTGCTC 
GACGTTCAGG CGCTACTCGA GGGAACCGAA CCAGCCGACG ATCCGGCCGA CGTGCGGACG 
GTTGAAGCCG CCGCACGCGA CGACTTCAAC GAATCGCTGT CGACGGTCCT ATAG

Protein sequence

MFRRDFLTTA GATAGTLSTP AFVGPFDGRI GSSDTLTLAA LDAENIKTFG DLNPSFVFFY 
SDDSARSSLQ SWVDSSDDRV LKRDHPTVGM MTISMPWSEV GLKQYSAGVG DYDVGLERID 
GGAQALEYVD TIDANMVMSR PEPLEELEGT GVASLDLGFR EKVSMLAETG AWNPTPETAG 
LAFDEDAPEA TLSESRAHVR ADDTVLSGVD TSSLTVAVID TGVNTGLNLD ESRLHGESTG 
YAKDGDPTYS EEGTDAITDG DGHGTWVAHC IAGSNGFAPD ATVLGLKVLG DDGSGDTKDI 
IAGIEKAIDV GADVACLSLG SPQWSESLAA ALNDAREAGV FCAVAVGNDR YGTVWVASPA 
DADGGFGVQA CNVPESGDRD DTELAYFGNT GPDPGSTDLS GGDSEGAVPL LAAPGMSITI 
ELPSGLSTLS GTSMAAPHVA GGAAVSRAAG YGVDETWSRL IKYAYPLPNA GATEAKHGLL 
DVQALLEGTE PADDPADVRT VEAAARDDFN ESLSTVL