Gene Sare_2087 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2087
Symbol
ID	5704666
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	2401345
End bp	2402301
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	62%
IMG OID	641271572
Product	sphingomyelin phosphodiesterase
Protein accession	YP_001536943
Protein GI	159037690
COG category	[R] General function prediction only
COG ID	[COG3568] Metal-dependent hydrolase
TIGRFAM ID	[TIGR03395] sphingomyelin phosphodiesterase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.213788
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.145093
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAGAC TGCAGGGTCT GCTACTCGCC GTCGTTCTCG CCGCGACTGG ACTAGTCGCC 
TCCACCGGGG CCGCCCAGGC TGCACCGGCG CCACTGAAGG TACTGACACA CAACGTGATG 
CTTCTGCCAC AGTCGCTCTA CCCCAACTGG GGTCAGGTCA CGCGGTCCGA CCTTATTTCC 
GAGGCCGACT ACATCACCGG CCGAGACATC GTTGTTCTCC AAGAAATGTT CGACAACGAG 
GCATCCAACC GACTCAAGGA TCGTCTCGCC GCCCAGTACC CCTATCAGAC ACCTGTCCTC 
GGCCGGTCGC GGTCCGGCTG GGATGCCACG ATGGGGGCGT ACTCCAACGT GACCCCGGAG 
GATGGCGGGG TCACGATCCT GAGTAAGTGG CCGATCCTGG AAAAAATCCA ATACGTCTAT 
GCCGATGGCT GCGGTGCCGA CTGGTTTTCC AACAAGGGAT TCGTCTACGC CCGCCTCGAT 
GTCAACGGAG CCCCCTTACA CGTGGTGGGT ACGCACGCTC AGGCAGCCGA CACTGGCTGC 
GCCGACGGCA CCGGCGCCGG AGTCCGGGCA GCGCAGTTCG ACGAACTCCG CGCCTTCCTT 
GACGCCCGCC TCATTCCAAC AGGTGAACAG GTCATCATCA CCGGCGACCT GAATGTTGAC 
CGCTACTCCG CCGAATACGC AGGCATGTTG ACCCGGCTCG ACGTCAGCGA CACCTCGTTC 
ACCGGCCACC CGTACTCCTG GGACTCTGCG CGCAACGCCA TGGCCGACTA CAACGACGAC 
CGGAACAGCC GTCAACAGTT GGACTACGTG ATGCAGCGCA ACGGCCATGC CCGACATGGC 
TCAGGTGATA ACCAGACCCT GGCTGTCAAT GCACCGAAGT GGTGTGTGAC CAGCTGGTTC 
GTTCGCTACT GCTACACCGA CTACGCCGAC CACTATCCGG TCGCGGCAAA CGTCTGA

Protein sequence

MKRLQGLLLA VVLAATGLVA STGAAQAAPA PLKVLTHNVM LLPQSLYPNW GQVTRSDLIS 
EADYITGRDI VVLQEMFDNE ASNRLKDRLA AQYPYQTPVL GRSRSGWDAT MGAYSNVTPE 
DGGVTILSKW PILEKIQYVY ADGCGADWFS NKGFVYARLD VNGAPLHVVG THAQAADTGC 
ADGTGAGVRA AQFDELRAFL DARLIPTGEQ VIITGDLNVD RYSAEYAGML TRLDVSDTSF 
TGHPYSWDSA RNAMADYNDD RNSRQQLDYV MQRNGHARHG SGDNQTLAVN APKWCVTSWF 
VRYCYTDYAD HYPVAANV