Gene Htur_2098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_2098
Symbol
ID	8742698
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013743
Strand	-
Start bp	2167253
End bp	2168533
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	63%
IMG OID	646512680
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_003403654
Protein GI	284165375
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACTAA ACAGGCGATC GGTACTCAAG GGTATTGGTG CAACGGGTGT ATCACTAACG 
TTCGCGGGGT TCGCAAGTGC TGAGGGCGAT GCTCGGTATA TCGTTACCGT CGAAAACGAT 
CGTGCCCGTG ATCGTCTTGA GGCCGCGGAA TTCGCAATCA AAAACGTGCT CGCTGGCGGT 
GCTGTGGTAG TTGCCGTCGG CAGAGAAGAT GCAGTTGATG ATCTCGAAGG AATCCGGGGT 
GTCAGAACGG CCGCACGAGA CGTCTTATTC GCCCTGGAGG AGCCGGTGGC GACCGAACCG 
GCTGACGAAC ACTTCGACGA GCCCATTTTT TGGGATCGCC AGTGGGACAA GCACGTCACC 
GACGTAAGGC GGGCCCATCA AACGGCGACT GGGGACGGTT CCACGATCGC GGTCATCGAT 
ACGGGGATTG ACGCGAGCCA CCCGGACCTC CAGAACGTGG ACACCAATAA TAGCGCCGCG 
ATCATCGACG GTGACGTGAC CGCCGGCGAC GGTGGGCAGG TACACTGGCA CGGAACTCAC 
GTCGCGGGGA TCGCCGCCGC TCAGGGCGGG AGCGTCACTG GAATGGCACC GGACGCCACC 
ATCCTAAACT TGCGGGTGTT CCCGGAAGAG GGTGACTTGT TCGCGTCTGC GAGCGATATT 
CTGCTGGCCC TAGAGTATGC CGCCGACCAA GGTGCCGACG TAGCAAACAT CAGCCTCGGG 
GCGGGGCCCT ACCCTCCGCA GGCCAACGCC GGGGGACTCC GCGCCGCCCG CGAGAAGACC 
GTTAATAACG TGGTCCGCCG AGGGCTGCTT GTCTCCGCGA GTGCTGGTAA CGAGGACGCG 
AACCTCAAGC AAGGCGGGTT CTTCCACCTC ACGAGCAGCG TCGCCGGCGC GATGAGCGTC 
AGCGCCACCG GTCCGGACGA CCTCCGAGCA TTCTACTCGA ACTACGGCTC TAATGACATC 
GCCGTCGGGG CGCCGGGCGG CGGGTACGAG ACAAGTGAGA AGACCGAGAG CACGGACACT 
CCATGGCCGT ACCCGCACAA CCTCGTGTTT TCGACACTCC CCGGCCCGAG TTACGGGTGG 
GCAGCCGGGA CGTCGATGGC GGCCCCGCAG GTCACCGGCG CCGCTGCGCT CGTCCACGAG 
GTCGCCCCCG ACGCTAACGC GCGTCAGGTT GAACAGGCCA TCAAGAATGG CGCCGATCTC 
GTCAATGGGC AAAACGACGA CGACCTCGGT GCGGGTCGCT TGAACGCTGC CGACGCACTG 
GATGCGCTAC GAGTACGCTA A

Protein sequence

MELNRRSVLK GIGATGVSLT FAGFASAEGD ARYIVTVEND RARDRLEAAE FAIKNVLAGG 
AVVVAVGRED AVDDLEGIRG VRTAARDVLF ALEEPVATEP ADEHFDEPIF WDRQWDKHVT 
DVRRAHQTAT GDGSTIAVID TGIDASHPDL QNVDTNNSAA IIDGDVTAGD GGQVHWHGTH 
VAGIAAAQGG SVTGMAPDAT ILNLRVFPEE GDLFASASDI LLALEYAADQ GADVANISLG 
AGPYPPQANA GGLRAAREKT VNNVVRRGLL VSASAGNEDA NLKQGGFFHL TSSVAGAMSV 
SATGPDDLRA FYSNYGSNDI AVGAPGGGYE TSEKTESTDT PWPYPHNLVF STLPGPSYGW 
AAGTSMAAPQ VTGAAALVHE VAPDANARQV EQAIKNGADL VNGQNDDDLG AGRLNAADAL 
DALRVR