Gene Strop_3040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_3040
Symbol
ID	5059504
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	3470672
End bp	3471850
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	68%
IMG OID	640475290
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_001159855
Protein GI	145595558
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.667791
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.694624
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTCCGT CCTCAGAACG CGTCAACCGA TTCGCTGCCC GCCGTCGGGC GCGGCTGGAG 
GGCCTTCCAA AGCTCGCGCA GACCGCTGTC GGCGGTAGCG CCCGGGCGTG GTTCGTCGCT 
GACGAGTTAC TGGTCGTCGA CGACAGTCGC CGGGATGCCG AACGCTATCT TGGACGTGCT 
CGGGCCGCGC AGCCTGACGC CGGCGACGAG GAGTTACTGC CCGGCCTGCG TCGCTATCGG 
GCGCCGGGGC TGGACGTACC GGCTGCGGTT CGCGCGCTGC GCTCGGGTCG TCCGGCCGGC 
AACCAGGTGG TCAGCCCGAA CCATGTCTTT CTGTCCAGTC CGTTCAACCA CGGAGGTCCG 
TTCGGGCCGC CGGCGCCCGT AGCCGCATCG ACGTTCAAGA TGCCGGCCGA GACCGATCGG 
GTCGCGGTAT CCATCGTTGA CACCGGGTTC TGGACCGAGA CCCCCCTTCC GGCCGACTAC 
CTCGCCTCGG ACGGTGTGGA GGTGGAGACG GAAACCGATG TCGATGAAGA CGGGCTGCTC 
GACGGCGACG TGGGGCACGC CAACTTCATC GGTGGTGTCA TCGCGAATCA TACGGACCGG 
GCAATGTTAC GGGTGATCCG GACATTGGAT ACTTTTGGTG TCTGCACGGA GGATCAGTTG 
ATCGCCTCGC TGGGCCGGCT GCACCCGGAC ACCAAGGTGA TCAACCTTTC CCTCGGTGGC 
TTCACCGCCG ACGGATCCGC GCCGCTCGGC GTACGCGCGG CGTTGGGGCA GGCCCTGTCC 
GGGATCGACC GGGTGGTGGT CGCTGCTGCC GGCAACGACG GCAACCGCAG CGACCCGTTC 
TGGCCCGCAG CGTTCGCCAA TGCCGGCGAG TCGTGGAGTG GGCAGGTACT GGCGGTCGCC 
GCGCACGACG GCAGCGACCT GTGCTCCTGG AGCAACGCTG GACCGTGGGT CAGCGTCGTC 
GCGCCGGGTG AGGACGTTCG AAGCACGTAC ATCGACCACG CTCTGTTCCC AGAGGGGTGG 
GCGCAATGGA GCGGAACGTC GTTCGCCGCG CCGCGAGTGG CTGCCGAACT CTCCGCGCGG 
ATCGACTCGG AGGTCGGCGC GGTGGCCGCT GCCAACCAGC TAATGGCCGA TCTGAGGGCG 
TCCAACCAGC GGTTTGGAGG CCACCTCGGG CTGATCTGA

Protein sequence

MPPSSERVNR FAARRRARLE GLPKLAQTAV GGSARAWFVA DELLVVDDSR RDAERYLGRA 
RAAQPDAGDE ELLPGLRRYR APGLDVPAAV RALRSGRPAG NQVVSPNHVF LSSPFNHGGP 
FGPPAPVAAS TFKMPAETDR VAVSIVDTGF WTETPLPADY LASDGVEVET ETDVDEDGLL 
DGDVGHANFI GGVIANHTDR AMLRVIRTLD TFGVCTEDQL IASLGRLHPD TKVINLSLGG 
FTADGSAPLG VRAALGQALS GIDRVVVAAA GNDGNRSDPF WPAAFANAGE SWSGQVLAVA 
AHDGSDLCSW SNAGPWVSVV APGEDVRSTY IDHALFPEGW AQWSGTSFAA PRVAAELSAR 
IDSEVGAVAA ANQLMADLRA SNQRFGGHLG LI