Gene Sare_4661 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4661
Symbol
ID	5705718
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	5281539
End bp	5283227
Gene Length	1689 bp
Protein Length	562 aa
Translation table	11
GC content	69%
IMG OID	641274059
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_001539405
Protein GI	159040152
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCAGAC GCTTCACCGC TGGTGCCGTC GCCACCGTGA CGGGCCTGGC GCTGACCGTA 
GCTGGGCTGG GTGTCCCGGC GGGCGCCGCA CCGAGCAGCA CCCAAACCTT CACTGTGGTC 
GCTGAGGACG GCGTTACCGC TGATGTGGCC CTTGCGGAGA TAGCGGCGGC CGGAGGCACC 
GTCGTATCCC GGATCGACGA TGTCGGCGTG TTCCAGGTGA CCAGCGACCA GGCGGACTTC 
GCCGCCCGGA CCGCCGCCGC CGGCGCCCTG GTCGGCGCCG TCGAGCAGAA GGCCATCGGT 
CACAAGCCCA GGCTGGACCC GGTCGAGCAG GAGGCGCTGC TGGCCGCCGC TACCGGCAAG 
GGCTCCGGCG CCCGCAAGTC CAAGCGGATG GACCCGCTGG ACGACAAGCT GTGGGGCCTG 
GACATGATCA GGGCCGACCG CGCCCGCAAG GTGGAGCCTG GCGACCGGCG AGTCACCGTC 
GGCGTCCTGG ACACCGGCCT CGACGCCAGC CACCCGGACA TCGCGCCGAA CTTCAACTGG 
GCGTTGTCCC GTAACTTCGC GCCGGACATG CCCGAGGTGG ACGGCGAGTG CGAGGTGGCG 
AGCTGCCTCG ACCCGGTCGG CACCGATGAC GGCGGCCACG GCACCCACGT GGCGGGCACC 
ATCGGCGCCG CCGCAAACGG ATTCGGCCTC TCGGGCGTCG CGCCGAAGGT CTCGTTGGTG 
GAGCTGAAGG GCGGCCAGGA CTCCGGCTAC TTCTTCCTGG AGCCGGTGGT CCAGTCGCTG 
ATGCACGCCG GTAGGGCGGG CCTGGACGTG GTGAACATGT CCTTCTACGT CGACCCGTGG 
CTCTACAACT GCACCGCCAA CCCGGCCGAC TCCCCCGAGC ACCAGGCCGA GCAGCGGGCC 
ATCATCAAGG CGATGAAGCG GGCGCTGAAC TTTGCCCACA AGCGGGGCGT GACGCTGGTC 
GGCTCACTCG GCAACAACCA CGAGGACCTG GGCGACCCCC GGATCGACAC GTCCAGCCCG 
GACTTCGGCG ACACCCCGCC GTACCCGCGC GAGATCGACA ACGACAGCTG CTGGGACCTT 
CCGGTCGAAG GCCCGCACGT CATCGGCGTC TCCGCCATCG GCCCCTCCGG CAAGAAGGCC 
GCCTACTCCA ACTACGGCAC CGAGCAGATC GGCATCGCCG CTCCCGGGGG CTGGTTCCGC 
GACGGTTTCG GCACCGACAC CTTCCGCACC TACGGCAACC TGATCCTCTC CACCTACCCC 
GAGAAGGTGC TCAAGGAAGA CGGTCTGGTG GACGCGGACG GCAACATCGA TCCGAGCGCC 
GAAGGGCTCG TGTTCAAGGA ATGCAAGAGC AACGGTGAGT GCGGCTACTA CCGCTACCTC 
CAGGGCACCT CGATGGCGTC GCCGCACGCC TCGGGTGTGG CCGCGCTGAT CGTCAGCAAG 
CATGGCAAGA AGCAGGGCCG GGCCGGTTAC GGCCTGGACC CGGACCTGGT CGAGCGGCAC 
CTCTACCGCA CCGCCACCGA GCAGGCGTGC CCGAACCCGC GCCTGCAGCA GTACCGCGAC 
GAAGGCCGCG ACGAGACCTA CGACGCGTAC TGCGCCGGTG GGCGCAACTT CAACGGCTTC 
TACGGGTACG GCGTCATCGA CGCGTACGCG GCGGTAGCCA CCCCACTCAA GTCACACGGC 
CGACCGTAG

Protein sequence

MSRRFTAGAV ATVTGLALTV AGLGVPAGAA PSSTQTFTVV AEDGVTADVA LAEIAAAGGT 
VVSRIDDVGV FQVTSDQADF AARTAAAGAL VGAVEQKAIG HKPRLDPVEQ EALLAAATGK 
GSGARKSKRM DPLDDKLWGL DMIRADRARK VEPGDRRVTV GVLDTGLDAS HPDIAPNFNW 
ALSRNFAPDM PEVDGECEVA SCLDPVGTDD GGHGTHVAGT IGAAANGFGL SGVAPKVSLV 
ELKGGQDSGY FFLEPVVQSL MHAGRAGLDV VNMSFYVDPW LYNCTANPAD SPEHQAEQRA 
IIKAMKRALN FAHKRGVTLV GSLGNNHEDL GDPRIDTSSP DFGDTPPYPR EIDNDSCWDL 
PVEGPHVIGV SAIGPSGKKA AYSNYGTEQI GIAAPGGWFR DGFGTDTFRT YGNLILSTYP 
EKVLKEDGLV DADGNIDPSA EGLVFKECKS NGECGYYRYL QGTSMASPHA SGVAALIVSK 
HGKKQGRAGY GLDPDLVERH LYRTATEQAC PNPRLQQYRD EGRDETYDAY CAGGRNFNGF 
YGYGVIDAYA AVATPLKSHG RP