Gene Htur_3053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_3053
Symbol
ID	8743672
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013743
Strand	-
Start bp	3133445
End bp	3135181
Gene Length	1737 bp
Protein Length	578 aa
Translation table	11
GC content	69%
IMG OID	646513638
Product	metalloendopeptidase, glycoprotease family
Protein accession	YP_003404593
Protein GI	284166314
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0533] Metal-dependent proteases with possible chaperone activity
TIGRFAM ID	[TIGR00329] metallohydrolase, glycoprotease/Kae1 family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAATTCTG ACATCCGAAT CCTCGGAATC GAAGGCACCG CCTGGGCGGC CAGCGCGGCA 
GTCTACGATT CCGCGACCGA CGACGTCTTC ATCGAGAGCG ACGCCTACCA GCCCGACAGC 
GGCGGCATAC ACCCCCGCGA GGCCGCCGAA CACATGCACG ACGCGATTCC CCGCGTCGTC 
GAGACCGCAC TCGAGCACGC CCGCGAGACC CACGACGGGC CCGCCGGCGA GGCGCCGGTC 
GACGTCGACG AGCGAAGCTC GTCGGGCCAA CAGGCTGCGC CTGTTGATGC CATTGCGTTC 
TCTCGAGGGC CGGGGCTCGG CCCCTGTCTG CGGATCGTCG GCACGGCCGC CCGGGCGCTC 
TCGCAGGCGC TCGAGGTCCC GCTCGTCGGC GTCAACCACA TGGTCGCCCA CCTCGAGATC 
GGGCGCCATA CGGCGGACTT CGACTCGCCA GTCTGTCTGA ACGCCAGCGG CGCCAACGCC 
CACCTCCTGG CCTATCGCAA CGGCCGCTAC CGCGTGCTCG GGGAAACGAT GGACACCGGC 
GTCGGCAACG CTATCGACAA GTTCACCCGC CACGTCGGCT GGTCCCACCC CGGCGGGCCG 
AAGGTCGAGG CGGCCGCCGA GGACGGCGAG TACGTCGACC TCCCGTACGT CGTCAAGGGC 
ATGGACTTCT CCTTTTCGGG GATCATGAGC GCCGCAAAGC AAGCTTACGA CGACGAGACG 
CCGGTCGAGG ACATCTGTTT CTCGCTGCAG GAGAACATCT TCGGCATGCT GACCGAAGTG 
GCCGAACGCG CGCTCTCGCT GACCGGCAGC GACGAACTCG TGCTGGGCGG CGGCGTCGGA 
CAGAACGAGC GCTTACGCGA GATGCTCGCG GAGATGTGCG CCCAGCGCGG GGCCGAGTTC 
CACGCGCCCG AACCCCGGTT CCTCCGGGAC AACGCCGGCA TGATCGCCGT GCTCGGCGCG 
AAGATGTACG AGGCCGGCGA CACACTCGAG ATCGAGGACT CGCAGGTCGA TCCGAACTAT 
CGGCCGGATC AGGTGCCGGT GACGTGGCGA CGCGACGAGC CCGAGCTCGC GGCCGGCCGC 
GGGGCGGACG GCAGCGAGAC GCAGGTCCGC GGCGCCGAAG CGCTCGTCGA CCTCGAGCCC 
GAAACCGGCC GTGTCACGAA ACACCGCGAG GTCAAGAGCT ACCGCCATCC CGAACTCGAC 
GAGCGACTGC GCCGCGAGCG GACGACCCTC GAGGCCCGCC TGACCAGCCT CGCACGCCGC 
GAGGGGGTGC CGACGCCGGT GCTCTCGGAC GTCGATCCGC GGGAGGCGCG CCTCGAACTC 
GAGTACGTCG GCGAGACGGA TCTCCGCGAT GGGCTGACCG CCGAGTGCGT TCGCGACGTC 
GGTCGACACC TCGCACGACT GCACTGGGCC GGGTTCGTCC ATGGCGATCC GACGACGCGA 
AACGTCCGCG TCGGGCGTGC GGGACGCGAC GCCTCCCGAG ACGAGCGAAC GGACGAAGTC 
CGTGAGCGAA CCGTCCTCAT CGACTTCGGC CTCGGCTACC ACACCGACCA CGTCGAGGAC 
TACGCGATGG ACATCCACGT CTTCGACCAG AGCCTCGTCG GTACCGCCGA TGACCCCGAC 
CCGCTCCGCG AGGCGCTTCG GGAGGGCTAC CGCGAGGTCG GCGAGGAGCG AGTGCTCGAG 
CGCCTGCGGG ACGTCGAGGG ACGCGGCCGG TACGTTACCG ACGACGCTCC GGAATAG

Protein sequence

MNSDIRILGI EGTAWAASAA VYDSATDDVF IESDAYQPDS GGIHPREAAE HMHDAIPRVV 
ETALEHARET HDGPAGEAPV DVDERSSSGQ QAAPVDAIAF SRGPGLGPCL RIVGTAARAL 
SQALEVPLVG VNHMVAHLEI GRHTADFDSP VCLNASGANA HLLAYRNGRY RVLGETMDTG 
VGNAIDKFTR HVGWSHPGGP KVEAAAEDGE YVDLPYVVKG MDFSFSGIMS AAKQAYDDET 
PVEDICFSLQ ENIFGMLTEV AERALSLTGS DELVLGGGVG QNERLREMLA EMCAQRGAEF 
HAPEPRFLRD NAGMIAVLGA KMYEAGDTLE IEDSQVDPNY RPDQVPVTWR RDEPELAAGR 
GADGSETQVR GAEALVDLEP ETGRVTKHRE VKSYRHPELD ERLRRERTTL EARLTSLARR 
EGVPTPVLSD VDPREARLEL EYVGETDLRD GLTAECVRDV GRHLARLHWA GFVHGDPTTR 
NVRVGRAGRD ASRDERTDEV RERTVLIDFG LGYHTDHVED YAMDIHVFDQ SLVGTADDPD 
PLREALREGY REVGEERVLE RLRDVEGRGR YVTDDAPE