Gene Csal_0229 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_0229
Symbol
ID	4027312
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	260737
End bp	261843
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	57%
IMG OID	637965380
Product	CRISPR-associated Cse4 family protein
Protein accession	YP_572292
Protein GI	92112364
COG category
COG ID
TIGRFAM ID	[TIGR01869] CRISPR system CASCADE complex protein CasC/Cse4

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCACT TCATTCAGTT GCATCTACTA ACTTCTTATC CGCCCTCCAA CCTCAACCGT 
GACGATCTGG GCCGTCCCAA GACGGCGTTC ATGGGTGGCG CGCGCCGTTT GCGCGTCTCC 
TCCCAGAGTC TCAAGCGGAA TTGGCGCACC TCGACGCTCT TCGAGGAAGC GGTCGATGGT 
CACAGGGGAA CGCGCACCAA GCGATTGGGT AAGCAGGTAT TCGATCGCAT GAAAGATGCT 
GGTGCTGACG ACAAAATCGC CGGTAGTAGT GCTGAAAAGA TCGCGAGTAT CTTCGGTACG 
CTGCGCAAGG TTGGAAAGGG TGAGAAGCAC GAATTCGAGA TCGAGCAGCT CGTTCATGTC 
GGGCCGGAAG AGATTGCGGC GCTGGAAACA CTGGCCAATA CATTGGGGGC AGAAAAGCGC 
GAGCCGACTG ACGAAGAGAT CACGAATGTT CTCCTGCGAC GCCCGACAGC CGTCGATATT 
GCGCTCTTTG GACGTATGCT CACCGGGGAA AAAAATAAGC TCGTCAAATA CAGTGTAGAG 
GCTGCCTGCC AGGTCGCGCA CGCTATTACC GTCCATGCCG CCGAGGTCGA GGACGACTAC 
TTCACCGCAG TCGACGATCT CAATACCGGC GATGAGGATC GTGGCGCAGC GCATATCGGT 
GAGGCCGGTT TTGCCGCCGG GCTGTTTTAT CTCTACCTCT GCATTGATCG CGATCTACTG 
GTCGAGAATC TGCAAGGCAA TGCGGACTTG GCCGATCGCG CCATTGCTGC GCTGGTTGAA 
TCCGCCGTCA AGGTTTCGCC CAAGGGCAAG CAGAACAGTT TCGGCTCTCG CGCCCACGCC 
AGTTATCTGC TGGCAGAAAA AGGCGATCAG CAGCCGCGCT CGTTGTCGGC CTCCTTCCTG 
CAGCCGGTCA ATGGTGAAGG ACAAGCGATC AAGGCCATCA GCAAACTGGA ACGCCAGGCT 
CAGGCTTTCG ATGATGCTTA TGGTGCCGGC GCCGACAGTC GCTTTGTTCT CTCTGCCGAG 
CCGGATTATG AAAAGCCTCC GCTGAAGGGT GACGTCCAAA CGGGAAATCT GCAGGACCTG 
CTGACTTTCC TCAAGGGCGA TGACTAA

Protein sequence

MSHFIQLHLL TSYPPSNLNR DDLGRPKTAF MGGARRLRVS SQSLKRNWRT STLFEEAVDG 
HRGTRTKRLG KQVFDRMKDA GADDKIAGSS AEKIASIFGT LRKVGKGEKH EFEIEQLVHV 
GPEEIAALET LANTLGAEKR EPTDEEITNV LLRRPTAVDI ALFGRMLTGE KNKLVKYSVE 
AACQVAHAIT VHAAEVEDDY FTAVDDLNTG DEDRGAAHIG EAGFAAGLFY LYLCIDRDLL 
VENLQGNADL ADRAIAALVE SAVKVSPKGK QNSFGSRAHA SYLLAEKGDQ QPRSLSASFL 
QPVNGEGQAI KAISKLERQA QAFDDAYGAG ADSRFVLSAE PDYEKPPLKG DVQTGNLQDL 
LTFLKGDD