Gene Htur_2247 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_2247
Symbol
ID	8742851
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013743
Strand	+
Start bp	2314214
End bp	2315824
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	69%
IMG OID	646512830
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_003403800
Protein GI	284165521
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCTCT CGGCACCCGT TCTCGCCAGT GGTGGCGCTC TCGCCGGCGG TGTCGGCGCG 
TCGTCGGTCG ACGGACACGC CGGCAACGAG ACGACGGCCG ACGAGTCGAT CAGAATCGAC 
GACTCCCTCG AGTCGTCCGA CGGGACGGTC GAGATCGTGG TTCGACTCGA GGAGCCGGCA 
GTTCCCGACG CGGTCCCGAC CGACGATGCC GACGCGCACC TCGCGGACCA CGCCGAAGAG 
AGCCAGGAAC CGCTGCTCGA CTACGCCGAC CGAACCGCGG GGATCAGCGT CGAGACCGAG 
TTCTGGGTGG CCAACGCCGT GTTGCTCACC GTCGACACCG AGCGGGTCGA CCTCGAGACG 
TTCGCTCGGT TCCCCGCGGT CGAGGCGGTC CACGAGAACT TCGAACTCTC CATCCCCGAG 
CGGCCGCCGT CGAATGCGAC CGCACTGGGG GCGACGAACG GAGGGGAATC CACGACAACA 
GACGTCACCA CGACCGCTAC CGATCCGCAA CCGACCGCTG GACTCGAGTT ACTGAACGCG 
CCCGCCGTCT GGGAGGAGTA CGGAACGCGG GGCGAGGGGG TCCGCGTCGC CGTCCTCGAT 
ACCGGAATCG ACGCGACGCA CCCGGACCTC GACCTCTACA CCGACGATCC GTCGGATCCG 
ACGTACCCGG GCGGCTGGGC CGAGTTCGAC GGCAACGGGA ACCGCATCGA AGGATCGACG 
CCCTACGATT CCGGAACGCA CGGCACGCAC GTCAGCGGCA CCATCGCCGG CGGAACCGCG 
AGCGGCGCTC GAATCGGCGT CGCTCCGGAG GCGGAGCTGC TCCACGGGCT CGTCCTGCGC 
GAGACCAGCG GCTCGTTCGC ACAGATCGTC GCCGGCATGG AGTGGGCGCT CGCGTCCGAG 
GCCGACGTAA TCAGTATGAG CCTCGGATCG AACGGCAGAC ACGACGCGTT GATCGATCCG 
GTTCGAAACG CCAGGGACAG CGGCGCCGTC GTCGTCGCGG CGGTCGGAAA CGAGGGCGTC 
GAGACGTCAA ACTCGCCCGG GAACGTCTAC GACGCCGTCA GCGTCGGCGC CGTCGACGAG 
AGCGGTGTCG TCCCCGCGTT TTCCGACGGC GAACGGATCA ACCGATCCGA ATGGCAAACG 
TCGCTGCAAT CGTGGCCGTC GTCGTACACC GCTCCCGACG TCGTGGCCCC AGGCGTCCGG 
GTTACGAGCA CCGTTCCCGG CGGCTATCAG TCGCTGCCGG GGACGTCGAT GGCGACCCCG 
CACGTCTCCG GAGCGGTCGC CTTGCTCCGC TCGATCGATC CGACTGCAAC GCCCGACGAC 
CTCAAGGACG CGCTGTACGG GACGGCCTGG ATACCCGAGA CGGCACAGGC ACGGTCGGAG 
ACGGAGATCC GCTACGGCCA CGGGATCGTC GACGCTGAGA CGGCGGCGGA CGCGCTCGTC 
GCGAGCGATC GGCGCCCCGT CAGAACGACC GCCGGCGAAT CCGCGGAGAC GCCCACCGAT 
GAGACGTCGG CGGGGCTCGT TACACACTTC GGCGGTGTGG TGATCGTCGT CGTCACGGTC 
GGCCTCTGGA CCCTCCGTTC CGGGTTCTCG TTCCCTCGCG ATGACCCGTG A

Protein sequence

MTLSAPVLAS GGALAGGVGA SSVDGHAGNE TTADESIRID DSLESSDGTV EIVVRLEEPA 
VPDAVPTDDA DAHLADHAEE SQEPLLDYAD RTAGISVETE FWVANAVLLT VDTERVDLET 
FARFPAVEAV HENFELSIPE RPPSNATALG ATNGGESTTT DVTTTATDPQ PTAGLELLNA 
PAVWEEYGTR GEGVRVAVLD TGIDATHPDL DLYTDDPSDP TYPGGWAEFD GNGNRIEGST 
PYDSGTHGTH VSGTIAGGTA SGARIGVAPE AELLHGLVLR ETSGSFAQIV AGMEWALASE 
ADVISMSLGS NGRHDALIDP VRNARDSGAV VVAAVGNEGV ETSNSPGNVY DAVSVGAVDE 
SGVVPAFSDG ERINRSEWQT SLQSWPSSYT APDVVAPGVR VTSTVPGGYQ SLPGTSMATP 
HVSGAVALLR SIDPTATPDD LKDALYGTAW IPETAQARSE TEIRYGHGIV DAETAADALV 
ASDRRPVRTT AGESAETPTD ETSAGLVTHF GGVVIVVVTV GLWTLRSGFS FPRDDP