Gene Htur_0739 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_0739
Symbol
ID	8741322
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013743
Strand	-
Start bp	760051
End bp	761166
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	69%
IMG OID	646511318
Product	peptidase S1 and S6 chymotrypsin/Hap
Protein accession	YP_003402309
Protein GI	284164030
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGGAC ACACCCCGGA TCGTCGCGAG TTCCTCGCGC TCGCCGGTAC CGGCCTCGTC 
GGCGCCGTCG CCGGCTGTAC CGAGCCCACC GCCAGCGACT CGATGGAGGG CTCGTCCTCG 
CACTCGATTT CGCAGGAGAT CGATCCCGAC AAGCGCGCGG ACGGCTCGAC GTACACCGAC 
GTCTACGAGG CGGTCATCGA CTCGGTCGCA CAGGTGCGGG CGCTAGGCGC CGGGAGCCCG 
TACGGTGGCG ACCGGAGCGG CGGCCAGGGC TCGGGCTTTC TCGTCGACGA CACCCACCTC 
GTCACGAACG AGCACGTCGT CGCCGGCGCC GACACCGTCG ACCTCCAGTA CATCAACGGC 
GACTGGTCGG CCACCAAAAT CGTCGGCGCC GACTTCTACA GCGACCTGGC CGTCCTGAAG 
GTCGATCACG TCCCCGACGA GGCGACGCCC CTCGAGTTGG CCGCCGAGCG CTCCGTCGTC 
GGTCAGGAGG TGCTCGCGAT CGGCAACCCC TACGGGTTCG AGGGCTCCAT GTCGAAGGGG 
ATCGTCAGCG GCGTCAATCG TACGCTCGAC ATGCCGGACC GGACGTTTTC GTTTTCGAAC 
GCGATCCAGA CCGATGCCGC GGTCAACCCC GGCAACAGCG GCGGGCCGCT GGTCAACCTG 
GACGGCGAAG TCGCTGGCGT CATCACCGCC GGCGGCGGGG ACAACATCGG CTTCGCGATC 
CCGTCGGCGG TCGCGAGTCG AGTCGTCCCC TCGCTGATCG AGACCGGAAC CTACGACCAC 
TCCTACATGG GGATCACCCT CGCAACCGTC GACCGGTATA TCGCCGAGGC CAACGACCTC 
CCCGAGGCGA CCGGCGTCAT CGTCACGGGG GTCGAATCCG GTGACCCGGC CGACGGCGTC 
CTCCGGGCCG CAACGCCCCG CCCGCGCGAC TCGATCCCCG TCGGGGGCGA CGTCATCTAC 
GCCATCGACG GCGAGCCGAT CCCCGACCGC CACGCGCTCT CGAGCCACCT CGCCTTGCGG 
ACCAGTCCGG GGGATACGAT CGAGATCGAG CGCTGGCGCT ACGGCGACGA GACCACGGTC 
TCGCTGACGC TCGGGGAGCG ACCGTCGGCC AACTGA

Protein sequence

MNGHTPDRRE FLALAGTGLV GAVAGCTEPT ASDSMEGSSS HSISQEIDPD KRADGSTYTD 
VYEAVIDSVA QVRALGAGSP YGGDRSGGQG SGFLVDDTHL VTNEHVVAGA DTVDLQYING 
DWSATKIVGA DFYSDLAVLK VDHVPDEATP LELAAERSVV GQEVLAIGNP YGFEGSMSKG 
IVSGVNRTLD MPDRTFSFSN AIQTDAAVNP GNSGGPLVNL DGEVAGVITA GGGDNIGFAI 
PSAVASRVVP SLIETGTYDH SYMGITLATV DRYIAEANDL PEATGVIVTG VESGDPADGV 
LRAATPRPRD SIPVGGDVIY AIDGEPIPDR HALSSHLALR TSPGDTIEIE RWRYGDETTV 
SLTLGERPSA N