Gene Hore_19260 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_19260
Symbol
ID	7312741
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	2059635
End bp	2060966
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	48%
IMG OID	643612372
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_002509668
Protein GI	220932760
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	0.775766
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAT TTCTAACTTT AACTCTGGTT ACCCTTCTGG CTGTGGCTCT TTTAACCGGG 
GGAGTATCGG CTGCCAGGAA GGTCAGGGTC ATGGTTGACT TTAACTACCT CAATGAGGAC 
AACCTGACAG AGTTAAAAAA ACATGTAGTT AAGGTAAATT ATAAGTTTCC GGAAATCAAT 
GTAGTTGCCC TGACGGTAAA GGATAATGAT ATCCCTGAGA TTAAGTCTTT GCCCGGTGTC 
AAAGGAGTTT ACCGTGATAA TCAGGTTAAA GTTCATGGGG GACTTGTTTC CTGGAATCTC 
GATGTAATTG ATGTTGAAAA GGTGCATACT GATCATATTA ATGAAGCAGA TGGTTCTGGG 
GTTTATGTAG CTGTTCTCGA TACCGGTCTT TTACCTAACT GGAAGGATTA TTTTCCGGAA 
GAAAAAATAG CATCTGAATA TGCGGCAGGA TTCCTCAATC CCAATGGTAA TCGTAATCCC 
GGGGCCTGGA CAGGGACCCA TGCCCATGGA ACCCATGTAG CCAGTACCAT TATTGGTTAC 
TATCTATACG GGACACCGGT TGATGGTGTG GCTCCGGGAG CGAAAATTAT TCCCGTTAAA 
GTACTCAATA ATAACGGTTA TGGCTATGAT TCTGCGGTTA CAGCCGGCAT CCTGTATGTT 
GCCAGCTTAA AGGCCAGTGG TAAAATTGTG GAGCCTGTTG TTATCAACAT GAGCCTCGGG 
AGTAGTGTCC CCAGTGCTCC GGAATTGAAG GCCATCAGGT ATGCTATAGA CCACGGGGTT 
ATTGTTGTGG CTTCAGCCGG GAATGAAGGC GAGGCCGGAA TGGGATACCC CGGAGGTTAT 
GATGAAGTAA TTTCATGTGG GGCAGTAGGC TGGAAAAATA TGTGGGTCAA AGGTTGGACC 
GGTGATGTTC CTGAAGAGGA TATAGCATCC CGGGTATTTG TAGCTAATTT TAGTAGCCGG 
GAACTTCCGG GCCAGCATCT GGATATTCTG GCTCCGGGGG TCTGGGTAAT CGGACCTTAT 
ACCCTTTATG GAGCAGCCCA TCCCCCCTAC TGGGCTAAAC AGGATAAGAT GGGCCAGTAT 
TATTATCTAA GTGGAACAAG TATGGCGGCC CCTCATGTAG CAGGGACCGC GGCTCTGTTA 
CTGGAGAAAA ACCCTGCCCT GACCCAGCGG GAGGTTGAAG AGATACTGAA GGAAACAGCC 
ACTTACATCC CACCGGCCAG TATATTTGTT CCCGATCCTG CCGGAGGTCA GACCTATACC 
TGGGGTAGTG ATGCCACAGG TTCTGGTTTG ATAGATGTAG ATGCGGCCCT GGAGGAGGCA 
GCTGGATACT AG

Protein sequence

MKKFLTLTLV TLLAVALLTG GVSAARKVRV MVDFNYLNED NLTELKKHVV KVNYKFPEIN 
VVALTVKDND IPEIKSLPGV KGVYRDNQVK VHGGLVSWNL DVIDVEKVHT DHINEADGSG 
VYVAVLDTGL LPNWKDYFPE EKIASEYAAG FLNPNGNRNP GAWTGTHAHG THVASTIIGY 
YLYGTPVDGV APGAKIIPVK VLNNNGYGYD SAVTAGILYV ASLKASGKIV EPVVINMSLG 
SSVPSAPELK AIRYAIDHGV IVVASAGNEG EAGMGYPGGY DEVISCGAVG WKNMWVKGWT 
GDVPEEDIAS RVFVANFSSR ELPGQHLDIL APGVWVIGPY TLYGAAHPPY WAKQDKMGQY 
YYLSGTSMAA PHVAGTAALL LEKNPALTQR EVEEILKETA TYIPPASIFV PDPAGGQTYT 
WGSDATGSGL IDVDAALEEA AGY