Gene Sare_0017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_0017
Symbol
ID	5707398
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	19079
End bp	20239
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	65%
IMG OID	641269541
Product	hemolysin-type calcium-binding region
Protein accession	YP_001534944
Protein GI	159035691
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.206697
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTGGTTC CCGCACTGGC ACTCGCTGTC GCCGGACTGG GTGCACCAGC AGCAGCTGCC 
CCAGCCGCAT CCGTTCTGGA ATGTGCAGGT AAGCCGGCCA CGATCGTCGG TACGCCCGGG 
TTCGACAACA TCGTCGGCAC TCCCGCCGCG GACGTGATCG TTGCCCTCGA CGGAGATGAC 
GCCATTCGTG GCCTGGGCGG CGACGACACC ATCTGCGGTG GTGACGGTGC GGATGTCATC 
TTCGGGCAGG ACGGCAACGA CCTCGTCCTC GGTGACGCTG GACACGACAT CATCCAGGGT 
GGTGCCGGTG ACGACGACCT CCGCGGCGGC GCCGGGCACG ACATTGTCGG TGGGGGAGAC 
GGGGATGACG ACGTCATCGG CGACCCTGGC CATGACCGCC TCACCGGCGG AAACGGCCGG 
GACTTCATGT CCGGTGATAC CGGTGACGAC CACATCTTCG GCAACAACGA CTTCGATGTC 
CTGCTCGGCG ACGCCGGTAA CGACCGTCTC TCCGGTGGCA GGGAAAACGA CCTCATCTTT 
GGTGGAGCCA ACAACGACAT CCTCTCCGGC GGCCACGGTG ACGACGGTCT CGACGGCGGC 
CCCGGAAACG ACACCCTCAC CGGTGGGGAC GGAGACGACG GCCTGGTAGG GGGCAGCGGC 
AACGACCAGC TTTCTGGCGG GGCCGGCAGT GACGGTCTCG AGGGCGATGA CGGAAACGAT 
CGACTCACCG GCGGCAGCGG AGACGATGGG CTTGGCGGCG GGTCCGGTGA CGACATTCTC 
ATCGGTGGCG ACGGAAACGA CGGCCTCAAT GGCGGTAACG GTCGCGACCA AATCTCCGGG 
GGCAAGGGAA CCGAACTGAT ATTCGGAGGT GCCGGCGACG ACATCATCCA GGGCGGTAGT 
GACAGCGATC GAATTCTGGG TGACGCGGGC AACGACCGCA TCCACGGCAA CGGCGGCGAC 
GACATCATCG ATGGCGGCGC CGGCAACGAC TTCGCCTCCG GTGGTAATGG AAATGACCGC 
ATGGAGGGTG GATCCGGTAA CGACCGTCTC TTCGGAAATG CCGATGACGA CAACCTCGAT 
GGTCAGACCG GCGTGAACTT CAACAATGGT GGTGCCGGGA CCAACATCTG CCAGAACCCC 
GCGGTGGGAC CTGGCTGCTA G

Protein sequence

MLVPALALAV AGLGAPAAAA PAASVLECAG KPATIVGTPG FDNIVGTPAA DVIVALDGDD 
AIRGLGGDDT ICGGDGADVI FGQDGNDLVL GDAGHDIIQG GAGDDDLRGG AGHDIVGGGD 
GDDDVIGDPG HDRLTGGNGR DFMSGDTGDD HIFGNNDFDV LLGDAGNDRL SGGRENDLIF 
GGANNDILSG GHGDDGLDGG PGNDTLTGGD GDDGLVGGSG NDQLSGGAGS DGLEGDDGND 
RLTGGSGDDG LGGGSGDDIL IGGDGNDGLN GGNGRDQISG GKGTELIFGG AGDDIIQGGS 
DSDRILGDAG NDRIHGNGGD DIIDGGAGND FASGGNGNDR MEGGSGNDRL FGNADDDNLD 
GQTGVNFNNG GAGTNICQNP AVGPGC