Gene Strop_4224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_4224
Symbol
ID	5060709
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	4790045
End bp	4791760
Gene Length	1716 bp
Protein Length	571 aa
Translation table	11
GC content	68%
IMG OID	640476486
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_001161030
Protein GI	145596733
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.576442
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTAGAC GCTTCACCGC TGGCGCGGTC GCTACCGTGA CGGGCCTGGC GCTGACGGTC 
ACGGGGCTGA GTGTCCCCGC CGGCGCCGCA CCGAGTAGCA GCGAAACCTT CACTGTGGTC 
GCGGAGGACG GCGTCAGCGC CGAGGCGGCC CTGGCGGAGA TCCAGGCAGC TGGGGGCGCC 
GTCGTAAACC GGATCGACGA TGTCGGCGTG TTCCAGGTGA CCAGCGACCA GGTGGACTTC 
AGCGATCGGA TTGCCGAGGC CGACAACCTG ATCGGTGCCG TCGAGCAGAA GGCCATTGGC 
CGCAAGCCCA AGCTGGACCC GGTGGAGCAG GAGGCGTTGC TGACCGCCAT CAGCGGTAAG 
AGCTCCGGCA AGGACAAGGA CAAGGGCAAG GGCTCCGGCG GCAAGGGCAA GGGGATGGAC 
CCGCTGGACG ACAAGCTGTG GGGCCTGGAC ATGATCCGTG CCGACAAGGC CCGCAAGAAG 
GAGCCCGGCG ACCGGCGCGT CACCGTCGGC GTGCTGGACA CCGGCGTCGA CGCCAGCCAC 
CCCGACATCG CACCGAACTT CAACTGGGCG TTGTCCCGCA ACTTCGCGCC GGACATGCCC 
GAGGTCGACG GTGAGTGCGA GGTAGCGAGC TGCCTCGACC CGGTCGGCAC CGATGACGGT 
GGCCACGGCA CCCACGTGGC CGGCACCATC GGGGCCGCCG CCAACGGTTT CGGCCTCTCC 
GGGGTCGCGC CGAACGTCTC ACTGGTGGAG CTGAAGGGCG GCCAGGACTC CGGTTACTTC 
TTCCTGGAGC CGGTGGTCCA GTCGTTGCTG CACGCGGGCC GGGCCGGCCT CGACGTGGTG 
AACATGTCCT TCTACGTCGA CCCGTGGCTC TACAACTGCA CCGCCAACCC GGCCGACTCG 
CCCGAACACC AGGCTGAGCA GCGGGCCATC ATCAAGGCGA TGAAGCGGGC GCTGAACTTC 
GCCCACAACC GGGGCGTCAC CCTGGTCGGC TCCCTCGGCA ACAACCACGA GGACCTGGGC 
GCCCCCAGGA TCGACACGTC CAGCCCGGAC TTCGGTGACA CTCCGCCGTA CCCGCGTGAG 
ATCGACAACG ACAGCTGCTG GGACCTGCCG GTGGAAGGGC CGCACGTGAT CGGCGTCTCC 
GCCGTTGGCC CCTCGGGCAA GAAGGCCGCC TACTCCAACT ACGGCACCGA GCAGATCGGC 
ATCGCCGCGC CCGGCGGCTG GTTCCGCGAC GGTTTCGGCA CCGACACCTT CAGCACCTTC 
CCCAACCTGA TCCTCTCCAC CTACCCGGAG AAGGTGCTCA AGGAAGACGG ACTGGTGGAC 
GCGGACGGCA ATATCGATCC GAGCGCCGAA GGGCTCGTCT TCAAGGAGTG CAAGAGCAAC 
GGTGAGTGCG GCTACTACCG CTACCTCCAG GGCACCTCGA TGGCGTCGCC GCACGCCTCG 
GGCGTGGCCG CGCTGATCGT CAGCAAGCAC GGGAAGAAGC AGGGCCGCAA CGGCTACGGT 
CTGGCCCCGG ACCTGGTCGA GCAGCACCTC TACCGCACCG CCACCGAGCA GGCCTGCCCG 
AACCCGCGTC TACAGCAGTA CCGCGACGAG GGCCGCGACG AGACCTACGA CGCGTACTGC 
GACGGTGGGC GCAACTTCAA CGGCTTCTAC GGGTACGGCG TCATCGACGC GTACACGGCG 
GTAGCCACCC CGCTCAAGTC GCACGGCCGA CGGTAG

Protein sequence

MSRRFTAGAV ATVTGLALTV TGLSVPAGAA PSSSETFTVV AEDGVSAEAA LAEIQAAGGA 
VVNRIDDVGV FQVTSDQVDF SDRIAEADNL IGAVEQKAIG RKPKLDPVEQ EALLTAISGK 
SSGKDKDKGK GSGGKGKGMD PLDDKLWGLD MIRADKARKK EPGDRRVTVG VLDTGVDASH 
PDIAPNFNWA LSRNFAPDMP EVDGECEVAS CLDPVGTDDG GHGTHVAGTI GAAANGFGLS 
GVAPNVSLVE LKGGQDSGYF FLEPVVQSLL HAGRAGLDVV NMSFYVDPWL YNCTANPADS 
PEHQAEQRAI IKAMKRALNF AHNRGVTLVG SLGNNHEDLG APRIDTSSPD FGDTPPYPRE 
IDNDSCWDLP VEGPHVIGVS AVGPSGKKAA YSNYGTEQIG IAAPGGWFRD GFGTDTFSTF 
PNLILSTYPE KVLKEDGLVD ADGNIDPSAE GLVFKECKSN GECGYYRYLQ GTSMASPHAS 
GVAALIVSKH GKKQGRNGYG LAPDLVEQHL YRTATEQACP NPRLQQYRDE GRDETYDAYC 
DGGRNFNGFY GYGVIDAYTA VATPLKSHGR R