Gene Hlac_2196 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2196
Symbol
ID	7401131
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	2179943
End bp	2181214
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	70%
IMG OID	643709268
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_002566843
Protein GI	222480606
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGAGC CAGCCTACAC CCGTCGTGGC GTGCTCCGAA CGATCGGGAG TGGATCCGCG 
GTCGGATCGC TCGCGACGCT CGGGACCGGA ACGGGCGCGG CGACGCGAAC CGCCGACGAA 
ACCGTGACCG TCAACGTTGG ATACGCGTCG GAGAGCGGCC GGAGCGCCGC GCTGTCTCGC 
GCGTCGGCGG TGGACCACGA GTTCGGCTTC GACGCGCTCA CAGCCCAGAT GCCCGAGTCG 
GAGACCGACG CGCTGGCGGC CCAACGCGAG ATCCGGTACG TCGAGGAGGA CCGCGCTCTC 
GGCGGTATCG TTACGCCGCG GAGGCAACCC CGCCGTCAGG TCGACGGACA GCGCGTCCCG 
TACGGCGTCG CCGTGACGGG GGCCGACGTG GCCGCGGAAC ACGGCTACAC CGGTAGCGGA 
GCGAACGTCG CGGTACTCGA CACCGGTATC GACAGCACGC ACCCCGACCT CGCGACGAAC 
CGGGGGAGAG GGGCCGCGTT CGTCCCGAGC GTCAGCGACA TCGAGGAGTT CGACTTCCCG 
GCCGGCCAGG ACGACGACAT CCTCGTCTCG CACGGCACGC ACGTCGCCGG CGTGGTCGGC 
GCGAACGACA ACGACACCGG TATCGTCGGT GTCAGTCCCG CGGCGACTCT CCACGCCGTG 
AAAGTCCTTA TCGGCGTGCT CGGCGGCGGC TCGGCGGCCG GCATCGCGGC GGGCGTGGAG 
TTCGTGGCTG ATCAGGGATG GGATGTCGCA AACCTCAGCT TAGGGGAGAC CGGACGGGTC 
GACGTGCTCG CGGACGCGGT AGCGGACGCC TACGAGCGCG GAGTCCTCCT CGTGGCGGCG 
GCCGGAAACG ATGGCCTCCT CGAAAACGAC CCGCCCGCGA GTGACGGAGA ATCGGCGGTT 
TCCTACCCGG CGGCCTTCGA GGAAGTCATC GCCGTTGGCG CGACCGACCG GAACGACGAC 
CTCGCGGCGT TCTCCTCGGT CGGTCCGGAG GTCGAACTCG CCGCCCCCGG CACGGACGTG 
CTGTCCACGG CCCTGCCGAT CAACATCTAC TCGAACGTGG AGGAGCCGTT CAACCGCTAC 
ATCGAACTGT CTGGGACCTC TTTCGCGGCC CCACACGTCG CCGGCGCGGG CGCACTGTTA 
ATGAGCGATG TCGGCCTCTC GAACGTTGAG GCCCGCGAGC GTCTCCGGGA GACCGCGGCC 
GACGTGGGCC TGCGCGAGGA CGAACAGGGC TACGGCCGCC TCGACGTCGC GGCCGCACTC 
GGTGTCGAGT GA

Protein sequence

MTEPAYTRRG VLRTIGSGSA VGSLATLGTG TGAATRTADE TVTVNVGYAS ESGRSAALSR 
ASAVDHEFGF DALTAQMPES ETDALAAQRE IRYVEEDRAL GGIVTPRRQP RRQVDGQRVP 
YGVAVTGADV AAEHGYTGSG ANVAVLDTGI DSTHPDLATN RGRGAAFVPS VSDIEEFDFP 
AGQDDDILVS HGTHVAGVVG ANDNDTGIVG VSPAATLHAV KVLIGVLGGG SAAGIAAGVE 
FVADQGWDVA NLSLGETGRV DVLADAVADA YERGVLLVAA AGNDGLLEND PPASDGESAV 
SYPAAFEEVI AVGATDRNDD LAAFSSVGPE VELAAPGTDV LSTALPINIY SNVEEPFNRY 
IELSGTSFAA PHVAGAGALL MSDVGLSNVE ARERLRETAA DVGLREDEQG YGRLDVAAAL 
GVE