Gene Strop_0039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_0039
Symbol
ID	5056470
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	45230
End bp	46789
Gene Length	1560 bp
Protein Length	519 aa
Translation table	11
GC content	68%
IMG OID	640472304
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_001156902
Protein GI	145592605
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTCTAT CCCGAAGGTC CGTGTTCGTT GGACTAGCCA CGATGGCCAT GGTGGCGTCC 
GCGACCCCCG CCATGGCCGC TGAACCAGTT GGTGAGATCC GTAGTGCGGG GGGCGCTACG 
GCCGTAACCG ACAGCTACAT CGTGGTCTTC AAGGACAACG TGGTCAGCCG TGCCACGGTC 
GAGACGTCGG TTGATCGTTT GGTGGACCGG CACGGTGGCC AGGTAAGCCG GACGTACAGC 
ACCGCGCTCC GCGGAGCCGA ACTGCGGGTG GATGCCGGTG CCGCCGCCCG AATCGCGGCC 
GACCCGGCGG TGGCGTACGT GGAGCAGAAC CACCGGGTGT CGATCACCGA CACCCAGACC 
AACCCCCCGT CCTGGGGTTT GGACCGAGTT GACCAGCGCG ATCTGCCGCT GGACAACTCC 
TACACCTATC CGAACACCGC CAGTGACGTG AACATCTACA TCCTCGACAC CGGCATCCGC 
ACCACCCACC AGGACTTCGG CGGCAGGGCC ACCTGGGGCA CCAACACCGC CGACAACAAC 
GATACCGACT GCAACGGGCA CGGCACGCAC GTCGCCGGCA CCGCTGCCGG CACGGCGCAC 
GGCATCGCCA AGGAGGCCAA CCTGGTGGCG GTGAAGGTGC TGGACTGCGC GGGCAACGGC 
ACCTTCGCCG GGGTCGTGGC CGGCGTCGAC TGGGTGACCG CGAACGCGGT CCAGCCCGCG 
GTGGCGAACA TGAGCCTCGG TGGCGGTGCG AACAGCGCGC TGGACAACGC GGTGAGCAAC 
TCGATCGACT CCGGTGTCAC CTACGCGCTG GCGGCGGGCA ACAGCAGCGC CAACGCCTGT 
AACTACTCAC CGGCCCGTAC CCCGGACGCG ATCACCGTCG GGTCTACGAC CAGCACTGAT 
GGACTGTCCT GGTTCTCCAA CATCGGCACC TGTCTGGACA TCTTCGCGCC GGGCTCGTCG 
ATCACCGCGC CGTGGATCAC CAGTGACACC AGCACGAACA CGATCAGCGG CACGTCGATG 
GCATCGCCGC ATGTCGCGGG TGCCGCGGCG TTGGTCCTGT CGGCCAACCC CTCGTACACC 
CCGCAGCAGA TTCGGGACGA GCTAGTCGAC AACGCCACCG ACGGCGCGAT CGGCTCCCCC 
GGCAGCGGCT CGCCGAACAA GCTCCTCTAC GTCGGTGACG GCGGCACCAC GCCTCCGCCG 
CCTCCGCCGC CGGGCTGCTC CGGCACCAAC GACACCGACG TGGCGATCCC GGACGCCGGT 
TCCGCGGTGA CCAGCTCGAT CACCATCGCC GGCTGCGACC GGGACGCCGC CGCCACCTCG 
ACCGTGGCCG TGGACATTCC CCACACCTGG CGGGGTGACC TCGTCATCGA CCTGATCGCG 
CCGGACGGCT CGTCCTACCG GCTGAAGACC AACAACCTGT CCGACTCCGC CGACAACGTC 
AACGAGACCT ACACGGTGAA CCTCTCCAGC GAGGCAGCCG ACGGCACCTG GCAGCTCCAG 
GTCCGCGATG TCTACCGCCA GGACACCGGC TACATCGACA CCTGGACCCT GACGGTCTGA

Protein sequence

MGLSRRSVFV GLATMAMVAS ATPAMAAEPV GEIRSAGGAT AVTDSYIVVF KDNVVSRATV 
ETSVDRLVDR HGGQVSRTYS TALRGAELRV DAGAAARIAA DPAVAYVEQN HRVSITDTQT 
NPPSWGLDRV DQRDLPLDNS YTYPNTASDV NIYILDTGIR TTHQDFGGRA TWGTNTADNN 
DTDCNGHGTH VAGTAAGTAH GIAKEANLVA VKVLDCAGNG TFAGVVAGVD WVTANAVQPA 
VANMSLGGGA NSALDNAVSN SIDSGVTYAL AAGNSSANAC NYSPARTPDA ITVGSTTSTD 
GLSWFSNIGT CLDIFAPGSS ITAPWITSDT STNTISGTSM ASPHVAGAAA LVLSANPSYT 
PQQIRDELVD NATDGAIGSP GSGSPNKLLY VGDGGTTPPP PPPPGCSGTN DTDVAIPDAG 
SAVTSSITIA GCDRDAAATS TVAVDIPHTW RGDLVIDLIA PDGSSYRLKT NNLSDSADNV 
NETYTVNLSS EAADGTWQLQ VRDVYRQDTG YIDTWTLTV