Gene SNSL254_A3148 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3148
Symbol	cas1
ID	6485656
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	3056854
End bp	3057771
Gene Length	918 bp
Protein Length	305 aa
Translation table	11
GC content	53%
IMG OID	642738456
Product	CRISPR-associated protein Cas1
Protein accession	YP_002042180
Protein GI	194444085
COG category	[L] Replication, recombination and repair
COG ID	[COG1518] Uncharacterized protein predicted to be involved in DNA repair
TIGRFAM ID	[TIGR00287] CRISPR-associated endonuclease Cas1 [TIGR03638] CRISPR-associated endonuclease Cas1, ECOLI subtype

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	68
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTGGC TGCCGCTGAA TCCCATCCCG TTGAAAGACC GTGTTTCGAT GATATTTCTC 
CAGTACGGAC AAATAGATGT GATCGACGGT GCGTTTGTGC TTATCGATAA AACGGGTGTA 
CGTACCCATA TTCCTGTTGG ATCGGTGGCC TGCATCATGC TGGAACCGGG GACGCGGGTT 
TCCCATGCCG CCGTGCGACT TGCGGCAACG GTGGGTACGT TACTGGTGTG GGTGGGGGAA 
GCGGGCGTAC GCGTTTACGC TTCGGGGCAG CCTGGTGGTG CCCGTTCCGA CAAATTGCTT 
TATCAGGCGA AACTTGCACT GGATGAAGAT TTGCGGCTGA AGGTCGTGCG TAAAATGTTT 
GAATTACGTT TTGGCGAACC CGCGCCGAGC CGTCGTTCTG TAGATCAATT GCGTGGTATT 
GAGGGGAGCC GTGTGTGGGC AACCTATGCA CTACTTGCTA AGCAGTATGG CGTGAAATGG 
CAGGGACGTC GCTACGATCC GAAAGACTGG GAGAAAGGCG ATGTCATTAA TCAGTGTATC 
AGCTCGGCAA CCTCCTGCCT CTATGGCGTA ACGGAGGCGG CAATACTGGC TGCCGGATAT 
GCGCCCGCGA TTGGATTTGT GCACACCGGC AAGCCGCTTT CTTTTGTCTA TGATATTGCC 
GATATCATTA AATTTGAGAC CGTTGTACCG AAAGCATTTG AAATTGCGCG ACGTAATCCT 
GCCGAGCCTG ATCGTGATGT CCGTATTGCC TGCCGGGATA TCTTCCGCAG TGGAAAAACA 
TTGGCGAAAT TGATTCCTCT TATTGAAGAT GTTCTCGCGG CAGGGGAAAT TCAACCGCCG 
TTACCTCCTG AAGATTCACA ACCCATAGCG ATCCCTCTTC CTGTTGCGTT GGGAGATTCC 
GGTCATCGGA GTACCTAA

Protein sequence

MSWLPLNPIP LKDRVSMIFL QYGQIDVIDG AFVLIDKTGV RTHIPVGSVA CIMLEPGTRV 
SHAAVRLAAT VGTLLVWVGE AGVRVYASGQ PGGARSDKLL YQAKLALDED LRLKVVRKMF 
ELRFGEPAPS RRSVDQLRGI EGSRVWATYA LLAKQYGVKW QGRRYDPKDW EKGDVINQCI 
SSATSCLYGV TEAAILAAGY APAIGFVHTG KPLSFVYDIA DIIKFETVVP KAFEIARRNP 
AEPDRDVRIA CRDIFRSGKT LAKLIPLIED VLAAGEIQPP LPPEDSQPIA IPLPVALGDS 
GHRST