Gene Hoch_2015 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_2015
Symbol
ID	8544397
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	2779743
End bp	2780957
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	69%
IMG OID	646386718
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_003266453
Protein GI	262195244
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.600934
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTCCTC GGAAGTTCGT GTTCCTCCTC GCCGCCAGCA CCCTTGGCGG CTCTCTGCTC 
ACCGGCTGCG CCACCGACAT GGAGGTGGAC GCCGGTAGCG ACCTCGACAC GGTGGCGACC 
ACGGTCGCGC CGCTGCTCGG TGGTGAAGGG TATGCCGCGC GCATCCCCGG GCAGTATCTG 
GTCATGTTCC ACGACGGCAT CGCGACGACC AGCGTCGACG CGGCCCTGGA CATGGTGGAA 
GCCAGCCCGG CCAACGAAGT GCTGTTCACC TACTCGGTGA TCAACGGCTT CGCCGCCAAG 
CTCGACGACA AGTCCCTGGA CGCGCTCCGT CGCAATCCGT CCGTGGCCTA TATCGAGTAC 
GATCAGGTGG CCACCATCAA CGCCGTGCAG AGCGGCGCGC GCCCCGGTCT CGACCGCATC 
GATCAGCGCA ACCGGCCGCA CAACGGCAGC TATGACGATC GCGGCTTCAA CGGCACCGGC 
ACGCACATCT ACGTGATCGA CACCGGCATC CGCGCGCACT CCGAGTTCAG CGGCCGCCTG 
GGCGCCGGCG CGACCGCCAT CAACGACGGC CGCGGCACCG ACGACTGCAA CGGCCACGGC 
ACCCACGTCG CCAGCAGCGC CGCCGGCACC CTCACCGGCG TAGCCAAGAA CGCCACCCTG 
CACGCCGTGC GCGTGCTCGA CTGCAACGGC TCGGGTTCGA ACTCGGGCGT CATCGCCGGC 
ATCGACTTCG TGCGCACCAA CGGCGTGCGT CCGGCCGTGG CCAACATGAG CCTGGGCGGC 
GGCGCCTCCT CGGCCGTGGA CACCGCCATC CGCAACCTGT TCAACAGCGG CGTGCTGCCG 
GTGGTGGCCG CGGGCAACGA GAACCAGAAC GCCTGCAACG TCTCGCCCGC GCGCGCCCCC 
GAGGCGCTCA CCGTGGCCGC GGTGGACGAC AACGACCGCC GCGCCTCGTT CTCGAACTTC 
GGTAGCTGCG TGGACATCTT CGCCCCGGGC GTGAACGTGC GCGGCGCCAG CATCAACGGC 
TCGAACTCGT TCGTCAACCT GTCCGGTACC TCGATGGCCA GCCCGCATGC CGCCGGTGTG 
GCCGCCATGG TGCTCGACAA GAACACGGGC GCCTCGGCCA GCTCGGTGAC CAGCAGCATC 
ATCTCGGCCG CGACCACGGG CGTGGTCAGC AACCGCAGCA GCGCGCCCAA CCGGCTGCTG 
TTCAACGGTA TCTGA

Protein sequence

MFPRKFVFLL AASTLGGSLL TGCATDMEVD AGSDLDTVAT TVAPLLGGEG YAARIPGQYL 
VMFHDGIATT SVDAALDMVE ASPANEVLFT YSVINGFAAK LDDKSLDALR RNPSVAYIEY 
DQVATINAVQ SGARPGLDRI DQRNRPHNGS YDDRGFNGTG THIYVIDTGI RAHSEFSGRL 
GAGATAINDG RGTDDCNGHG THVASSAAGT LTGVAKNATL HAVRVLDCNG SGSNSGVIAG 
IDFVRTNGVR PAVANMSLGG GASSAVDTAI RNLFNSGVLP VVAAGNENQN ACNVSPARAP 
EALTVAAVDD NDRRASFSNF GSCVDIFAPG VNVRGASING SNSFVNLSGT SMASPHAAGV 
AAMVLDKNTG ASASSVTSSI ISAATTGVVS NRSSAPNRLL FNGI