Gene SeD_A3252 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A3252
Symbol	cse4
ID	6873426
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	3123947
End bp	3125005
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	52%
IMG OID	642786267
Product	crispr-associated protein, Cse4 family
Protein accession	YP_002216908
Protein GI	198244668
COG category
COG ID
TIGRFAM ID	[TIGR01869] CRISPR system CASCADE complex protein CasC/Cse4

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.633483
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	0.732205
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAACGT TTATTCAGCT CCATTTACTG ACCGCTTACC CCGCCGCTAA CCTGAACCGT 
GATGATACCG GTGCGCCAAA AACCGTGGTG CTTGGCGGAG CAACACGTCT GCGTATCTCC 
TCTCAGAGCC TGAAACGCGC CTGGCGTACA TCTGAGTTAT TTGAACAGGC ATTAGCTGGC 
CATATTGGTA TTCGTACTGG TCGCATTGCT CGTGAGGCGG CGCAAATCCT CGTTGATAGC 
GGCATTGACG CTAAAAAAGC GGTTGAGTAT GTGGAAAAAA TTGCCAACTG TTTTGGCAAG 
GTAAAGGCGG AAAAGAAACC AAAAGATGAA CTGACGAATG CTGAAACCGA GCAACTGGTG 
CATATCAGCC CAGCTGAATT TGAGGGCGTA AAAGCGCTAG CGCACCGTCT GGCGGAAGAA 
AAACGCGCGC CAAAAGAGGA AGAGCTTGCA CTGCTACGTA AAGATCGCAT GGCTGTCGAT 
ATTGCCATGT TTGGCCGTAT GCTGGCGAAT AAGCCCGATT TTAACGTGGA AGCTGCCTGT 
CAGGTCGCCC ACGCCTTCGG CGTCAGCGAA ACGATCGTCG AAGACGATTT CTTTACTGCT 
GTGGATGACC TACGCCAGGC ATCGGCAGAA GATGCAGGCG CAGGCCATCT CGGCGAAACC 
GGCTTTGGCT CCGCGCTGTT TTACACCTAT ATCTGCATCG ACAAAGATCT GCTGGTGAAA 
AACCTGAACG GCAATGAAGA ACTGGCAAAC AAAACGCTGC GCGCCTTTAC TGAAGCGGCG 
CTGAAAGTGT CGCCGACCGG CAAACAGAAC AGCTTTGCCA GCCGTGCCTA TGCCTCGTGG 
GCGCTGGCGG AAAAAGGCAC CGACCAACCA CGTTCACTGG CGGCCGCGTT TTATGAACCG 
ATCAACGGTA CAGACCAATT GAACGTTGCG GTTAAGCGTA TTACCGCGCT GCGTGAAAAT 
ATGAATGCGG TCTATGCACA GGAGACGGCG TTCAAAGACT TTAACGTTAT GAATCAGCAG 
GGAAGCATGA AAGACGTGCT TGATTTCATC TGCGCGTAA

Protein sequence

MTTFIQLHLL TAYPAANLNR DDTGAPKTVV LGGATRLRIS SQSLKRAWRT SELFEQALAG 
HIGIRTGRIA REAAQILVDS GIDAKKAVEY VEKIANCFGK VKAEKKPKDE LTNAETEQLV 
HISPAEFEGV KALAHRLAEE KRAPKEEELA LLRKDRMAVD IAMFGRMLAN KPDFNVEAAC 
QVAHAFGVSE TIVEDDFFTA VDDLRQASAE DAGAGHLGET GFGSALFYTY ICIDKDLLVK 
NLNGNEELAN KTLRAFTEAA LKVSPTGKQN SFASRAYASW ALAEKGTDQP RSLAAAFYEP 
INGTDQLNVA VKRITALREN MNAVYAQETA FKDFNVMNQQ GSMKDVLDFI CA