Gene Sare_3147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3147
Symbol
ID	5706205
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	3581382
End bp	3582950
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	70%
IMG OID	641272579
Product	Ricin B lectin
Protein accession	YP_001537946
Protein GI	159038693
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.189477
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCGCA CGCTGAACGC GCTGGTGGGC TTCGTCCTCG GCATATGTCT CGTCACCGCG 
CCCGCCCCCG CCGTCGGCGC CGCTACCGCT GGTGTATCCG GCGCCTCGGA CACGCTCGCC 
ACACCGGTCG TCGCCACACC GGTCGCCGCT GAGCCGACAG CGCTCCCGGC CGGCCAACTC 
GAAGCCCTCC GGCGAGATCT CGACCTCACC GCCGACCAGT TGGCCGCGCG TCTCACCGTT 
GACGCCACCG CGCCGTCGAT CGAGCGGCGG ATGCGGGCCG AACTGGCCGA CGCGTACGCC 
GGAACCTGGA TCACCGCCGA TGGACGCACC ACGGTCGTCG GGTTGACCGA TCCGGCACTC 
GCCGACCAGA TCCGCGCCGT CGGGGCCGAG CCTCGAACCG TCACCCGCAG CCTCGCCGAG 
CTGAGGTGGC TCACCACCAG ACTGGACCGT CGGGCAGCGC GAGCCGGTGA CGCGGTACAC 
GCCTGGCATG TCGCGCCGGC CAGCAACACG GTCGCGATCC AGGCCAGCAA CCCCGCGGCC 
GCCACCAGCT TCGCCCGCGC CGCAGGGCTG CCCAACGACG CCGTGTCGGT GGTGGTCAGC 
GACGACGCCT ACCGCCCGGT CTACGACATC CGGGGAGGCG ACCAGTATGT GATCGACAAC 
CGCCTCATCT GCTCGGTCGG CTTCGCCGTG GCCGGCGGAT TCGTCACCGC CGGACACTGC 
GGCGACGTCG GCGAGCCCAC CAGTGGCTCC GGCGTCGCGC AGGGGACCGT CCGTGGCTCG 
TCATTCCCGG GCGACGACTA CGGCTGGGTC CAGACCAACG CCACCTGGAC TCCCCGACCA 
TGGGTGTCCA CCCACGACGG CAACGTGGTC ACGGTGACCG GGTCGCAGGA GGCGGCGGTC 
GGTGCCTCGG TCTGTCGGTC CGGCCGAACA ACCGGCTGGA GGTGCGGCAC CATCACCGCC 
ACGAACGTCA CCGTCAACTA CTCCGGCCAA CTCGTCCACG GGTTGGTCCG CAGCACCGCC 
TGCGCACAGC CCGGGGACTC CGGCGGGCCC TTCGTCGCCG GCTCCCAGGC ACAGGGTGTC 
ACCTCGGGTG CCGGCGGCGA CTGCGCCTCC GGCGGCACCA CCGTCTACCA GCCGGTCAAC 
GAGATCCTGT CCCGCTACGG GCTGTCACTC ACCACTTCTG GCGGCGGATC GACGAACAGG 
ATCATCGGTT TGGCCAACAA GTGCGTCGAC GTACCGGGCG CCAACGGGGC CGACGGGCAG 
TACCTGCACC TGTGGCACTG TAATGGCACC AACGCACAGG ACTGGACGTT CCCGGGCGAC 
GGCACCATCC GGGCCTTCGG CCTCTGCATG GACGTCGCCT GGGGTTCTCG GGAGAACGGC 
GCGGTGGTCC AGCTCGCGCA CTGCAGTGGC AACCCAGCCC AGCAGTGGGT GCTCACCGGC 
GCCAACGACC TCGTCAACCC ACAGGCGAAC AAGTGCCTCG ACGTCAAGGA CTGGAACAGC 
GCCGACGGCG CCCGGCTGCA AACCTACGAA TGCCATGGTG GCGCCAACCA GAAGTGGCGT 
CTCGGGTGA

Protein sequence

MSRTLNALVG FVLGICLVTA PAPAVGAATA GVSGASDTLA TPVVATPVAA EPTALPAGQL 
EALRRDLDLT ADQLAARLTV DATAPSIERR MRAELADAYA GTWITADGRT TVVGLTDPAL 
ADQIRAVGAE PRTVTRSLAE LRWLTTRLDR RAARAGDAVH AWHVAPASNT VAIQASNPAA 
ATSFARAAGL PNDAVSVVVS DDAYRPVYDI RGGDQYVIDN RLICSVGFAV AGGFVTAGHC 
GDVGEPTSGS GVAQGTVRGS SFPGDDYGWV QTNATWTPRP WVSTHDGNVV TVTGSQEAAV 
GASVCRSGRT TGWRCGTITA TNVTVNYSGQ LVHGLVRSTA CAQPGDSGGP FVAGSQAQGV 
TSGAGGDCAS GGTTVYQPVN EILSRYGLSL TTSGGGSTNR IIGLANKCVD VPGANGADGQ 
YLHLWHCNGT NAQDWTFPGD GTIRAFGLCM DVAWGSRENG AVVQLAHCSG NPAQQWVLTG 
ANDLVNPQAN KCLDVKDWNS ADGARLQTYE CHGGANQKWR LG