Gene Sare_4477 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4477
Symbol
ID	5706917
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	5058648
End bp	5060051
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	71%
IMG OID	641273893
Product	hypothetical protein
Protein accession	YP_001539242
Protein GI	159039989
COG category
COG ID
TIGRFAM ID	[TIGR02165] CRISPR-associated protein, GSU0054 family

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCTCTCG GCATCCTTGT GCGACTGCGG ACGGGACGTT ACGACGCGGC CAGCAACGAT 
CTGGCCTCAC CGGAGTGGCC TCCGCACCCC GCACGGTTGT TCTGCGCGCT CGTCGCTTCC 
ATGCAGGCTG ACGAGGACTG GGACGCGTTG CGTTGGCTGG AGGCTGCCCC GCTGCCGCAG 
GTATGGGCCG CGGCAGACGT CGCGACGGCC CGTACCGCGG GCTTTGTGGT GGTGAACGCG 
ACCGGTGGCC GGGGCAGCCA GATGTGGCCG GGGCGGGGCA GTGGCCTACG GCAACGGTCC 
AGCGTGCTGC CGAGCTGTGA CACGTTCGCG GTGGTGTGGC AGGCCGAACC GGACGACGCG 
ATGCTCGCAC GCCTGGTCCG TCTCGCGGCG CGGGTGCCCT ATGTCGGCCG CAGCACCTCC 
TCGGCGGAGG TGACGGTGGT GGTCGGATCG GTGCCGATCC GGCCGGAGTG GACTCGCCAC 
GTCCCGGTCC CGGTGGGTGC CGTAGGGAGT GTGCCGCTTC GGGTGCCGTT CGCTGGATAC 
CTGCGCCAGC TGGAGGACGC CTACGAGTCG GGGCTACCCG CGTGGCAGGT CGGGACGCCG 
TCCGTCGCCT ACGCCCCACA ATCCGAGCAG CTGGCCGAGG AACCGGTCTC GTCGGACCCG 
GTCGACGGAC CGTATGCGGA TCTCCTTGTG TGGGGTCTGC GGCATCCGAC GGTGCCGATG 
CGCGGAGACG ACGTGTTGAC CGTGACAGAC GGTCTGCGTC GTGCCGTGCT CAGCAGGGTC 
GCCGATCCGT TGCCGGCCGA GGTGAGTGGG CATGGCGCGG ACGGTCGGCC ACACGTTGCC 
TACCTGGGGC TGGTGGATGT CGGTCACCGC CATGCCCACG GTCATCTACT CGGCGTGGGC 
GTCGCGGTGC CGAGGCAGCT GTCCCGCGCC GATCGTCGTG TCCTGCTTCG CGGTCTGCTG 
GGTGTCGACG CGGCTGACCC TTTGTCGCTG CTACGCAGCC GGCGAGGGCA GCGGTTGGAG 
TTGCAGTACC CAGCCGTGTC ACGTCGCGGG CTGGACCCGC AGCGCTGGTG TCCACCGGGT 
GGCGCCCGGA CCTGGGTGAG TGTCACCCCG ATGATGCTGG ACCGCTACCC CAACCGCCGC 
CTCGACGTCA CCGAGGTGGT CGCCGGGTCG CTGCAGAATG CGGGATACCC GATACCGGAG 
AAGGTGGAGC CGCTGGCCGC GCCGGCGCTA CCCGGCGCGA TACGCCTCCC CCGACAGGGC 
ACCGTGCCCG GCTGGGCCCG GAAACCCCTA CTGCACTGCC GCATCTCGTT TCCGCAGCCT 
GTTCGCGGGC CGGTGATCGC CGGTGCGCTG CGCTACCTGG GCTGCGGGCT GTTCGTGCCG 
GAGGCCGAGC ATGCTGACCG TTGA

Protein sequence

MALGILVRLR TGRYDAASND LASPEWPPHP ARLFCALVAS MQADEDWDAL RWLEAAPLPQ 
VWAAADVATA RTAGFVVVNA TGGRGSQMWP GRGSGLRQRS SVLPSCDTFA VVWQAEPDDA 
MLARLVRLAA RVPYVGRSTS SAEVTVVVGS VPIRPEWTRH VPVPVGAVGS VPLRVPFAGY 
LRQLEDAYES GLPAWQVGTP SVAYAPQSEQ LAEEPVSSDP VDGPYADLLV WGLRHPTVPM 
RGDDVLTVTD GLRRAVLSRV ADPLPAEVSG HGADGRPHVA YLGLVDVGHR HAHGHLLGVG 
VAVPRQLSRA DRRVLLRGLL GVDAADPLSL LRSRRGQRLE LQYPAVSRRG LDPQRWCPPG 
GARTWVSVTP MMLDRYPNRR LDVTEVVAGS LQNAGYPIPE KVEPLAAPAL PGAIRLPRQG 
TVPGWARKPL LHCRISFPQP VRGPVIAGAL RYLGCGLFVP EAEHADR