Gene Sare_3515 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3515
Symbol
ID	5704643
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4055331
End bp	4056590
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	73%
IMG OID	641272942
Product	Ste24 endopeptidase
Protein accession	YP_001538308
Protein GI	159039055
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0501] Zn-dependent protease with chaperone function
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00730149
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGAGCCCGC GTGGCTGGGC CCTGCTCACG CTGGTCGGGC TGGTCGTCGC CCTGGCAGTC 
GCCGCCGCTG TGCTCGTTCC GTGGCAGCGC CCGCCGGCCC CGCGTGCCGA CCAGCTCGCC 
GCACTGGATG ACCTGCCGAG CGACCAGGTG ACCCGGGGGC GGGAGTTCCG GGCGGCGCTG 
CGCCCCGGCG GCTGGGCGGC TCTCGGCATC GGTCTCCTGG TGGCGCTCGC GCTTGGGCTC 
ACCCCGCTGG GTAGCCGCCT GGTCGAGCTG GCCGGCCGCC CATTCGGTGG ACACTGGGTC 
GCGCAGGCGG TGCTCGGCGG GCTCGCCGTG GTGCTCGTCG CCGACCTGGT CACCCTGCCG 
TTCGCCGCCT GGCGGCACAC GGTGCTCACC CGATACGGGC TGGCCACCAA CGGCTGGGGC 
GGCTGGACCG TCGACCTCCT CAAGTCGTAC GCGGTCAGCG CCGTGATCGG GGCGGTGGCG 
CTGGGTGCCT TCTACACCGT GATCCGACTG GCGCCACGCT GGTGGTGGGC GCTCGGCGCC 
GCCGGGGCGG CCGGCCTGGT GATGCTTCTG TCATTCGTGT TCCCGGTGCT GGTGGAGCCG 
GTTTTCAACC GGTTCACCCC GATGGCGCCG AGCCCACTGC GGACAGAACT GATGGACCTG 
GCCGCCCGTG ACGGAGTGCC GGTCCGGGAC GTGCTGGTAG CCGATGCCTC CCGCCGTACC 
CGCGCCGTCA ACGCCTACGT CTCCGGGCTG GGGCCGACCC GACGGATCGT CGTCTACGAC 
ACGTTGCTGC GCGAGGCCAC CCCGGTGGAG GTGAAGGCGG TGGTGGCGCA CGAGTTGGGG 
CACGCCAAGG ACCGGGACGT GGTGGTCGGC ACGCTCACCG GCGCGCTGGG CGCGGCGGTG 
GCGGTGGTGA CGCTCTACCT GCTCGGCTCC GCCGGTTCGC TGCTGCGTAT GGCCGGCGTC 
GACTCGATCG ACCAACCTCG CGCGTTCCCG TTGCTGTTGG CGCTGGTTAC CGTGGCCGGC 
CTGGTTTCCA CGCCGGCGCA GGCGGTGATC TCCCGGCGGG TCGAGGCCCG TGCCGACGCG 
CACGCGCTGA CGCTGACCGG CGACCCAGCC GCGTTCGAGG CGATGCAGCG CCGGCTCGCC 
AGCATCAACC TCGCCGACCC CGATCCACCC CGCCTGGAAT ATCTTTACTC CGCCAGCCAT 
CCGTCCACCG TGGAGCGAAT TGCCACCGCC CGCGCCTACG CCAGGAAGAC CACTAGATGA

Protein sequence

MSPRGWALLT LVGLVVALAV AAAVLVPWQR PPAPRADQLA ALDDLPSDQV TRGREFRAAL 
RPGGWAALGI GLLVALALGL TPLGSRLVEL AGRPFGGHWV AQAVLGGLAV VLVADLVTLP 
FAAWRHTVLT RYGLATNGWG GWTVDLLKSY AVSAVIGAVA LGAFYTVIRL APRWWWALGA 
AGAAGLVMLL SFVFPVLVEP VFNRFTPMAP SPLRTELMDL AARDGVPVRD VLVADASRRT 
RAVNAYVSGL GPTRRIVVYD TLLREATPVE VKAVVAHELG HAKDRDVVVG TLTGALGAAV 
AVVTLYLLGS AGSLLRMAGV DSIDQPRAFP LLLALVTVAG LVSTPAQAVI SRRVEARADA 
HALTLTGDPA AFEAMQRRLA SINLADPDPP RLEYLYSASH PSTVERIATA RAYARKTTR