Gene Sare_3266 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3266
Symbol
ID	5707553
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	3757996
End bp	3759174
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	69%
IMG OID	641272693
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_001538060
Protein GI	159038807
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0356463
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCCGT CCCCGGAACG CATCAGCCGA TTCGCCGCCC GCCGCCGGGC GCGGCTGGAG 
GGCCTCCCGA AGCTGGCACA CACCGACGCT GGCGGCGGCT CCCGCGCGTG GTTCGTCGCC 
GACGAGTTGC TGGTCGTCGA CGACAGTCGC CGGGAGGTTG AGCGCTATCT CGGACGTGCC 
CGGGCCGCAC AGCCCGGTGC CGGCGACGAG GAACTGATGC CGGGCCTGCG TCGCTACCGG 
GCGCCGGGAC TCGACGTGCC GACTGCGGTC CGCGCGCTGC GATCGGATCG TCCGGCTGGC 
CGCCAGACGG TCTGCCCCAA CCATGTCTTC CTGTCCAGTC CGTTCAATCA GGGAGGTCCG 
TTCGGGCCGC CGGCTCCCAC CGCCGCAGCG ACGCTCAAGA CGCCCGCCGA AACCGACCGG 
GTCGCGGTTT CCATCGTCGA CACCGGATTC TGGACCGACA CCCCCCTTCC GGTCGACTAT 
CTCGCATCGG ACGGCGTCGA GGTGGAAACG GAAACCGACG TCGACAACGA CGGGTTGCTC 
GACGGTGATG TCGGCCACGC CAACTTTATC GGTGGCGTGA TCGCGAACCA CACGGACCGG 
GCAGTGCTGC GGGTTGTCCG GACGTTGGAC ACCTTCGGCG TCTGCACCGA GGACGAGCTC 
ATCGCCTCCC TTGGACGGGT GCACCCGGAC ACCAAGGTGA TCAACCTGTC GCTCGGCGGT 
TACACCGCCG ACGGAACCGC GCCGCTCGGC GTACAGGCCG CGTTGCAGCA GGCCCTGTCC 
GGGCTCGACC GAGTGGTGGT CGCGGCCGCT GGCAATGACG GCAACCGCAG TGACCCGTTC 
TGGCCCGCGG CGTTCGCCGG TGCCGGCGAG TCGTGGAGTG GACAGGTGGT GGCCGTCGCC 
GCCCACGATG GCGTCGACCT GTGCTCCTGG AGCAACGCCG GATCGTGGGT CAGCCTTGTC 
GCACCTGGTC AGGACGTCCG AAGCACCTAT ATCGACCACG CGCTGTTTCC GGAGGGATGG 
GCGCAATGGA GCGGAACCTC GTTCGCGGCG CCGCGAGTGG CTGCCGAGAT CACGGCGCGG 
ATCGACGCAC AGGTTGGTGC GGTAGCTGCC ACCAACCAGT TCATGGCCGA CGTGGCAGCG 
GCCAACCAGC AGTTCGGAGG TCACCTTGGC TTGATCTGA

Protein sequence

MPPSPERISR FAARRRARLE GLPKLAHTDA GGGSRAWFVA DELLVVDDSR REVERYLGRA 
RAAQPGAGDE ELMPGLRRYR APGLDVPTAV RALRSDRPAG RQTVCPNHVF LSSPFNQGGP 
FGPPAPTAAA TLKTPAETDR VAVSIVDTGF WTDTPLPVDY LASDGVEVET ETDVDNDGLL 
DGDVGHANFI GGVIANHTDR AVLRVVRTLD TFGVCTEDEL IASLGRVHPD TKVINLSLGG 
YTADGTAPLG VQAALQQALS GLDRVVVAAA GNDGNRSDPF WPAAFAGAGE SWSGQVVAVA 
AHDGVDLCSW SNAGSWVSLV APGQDVRSTY IDHALFPEGW AQWSGTSFAA PRVAAEITAR 
IDAQVGAVAA TNQFMADVAA ANQQFGGHLG LI