Gene SeHA_C3135 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3135
Symbol	cse4
ID	6491245
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	3055575
End bp	3056633
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	53%
IMG OID	642743280
Product	Cse4 family CRISPR-associated protein
Protein accession	YP_002046899
Protein GI	194451697
COG category
COG ID
TIGRFAM ID	[TIGR01869] CRISPR system CASCADE complex protein CasC/Cse4

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	76
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAACGT TTATTCAGCT CCATTTACTG ACCGCTTACC CCGCCGCTAA CCTGAACCGT 
GATGATACCG GTGCGCCAAA AACCGTGGTG CTTGGCGGAG CAACACGTCT GCGTATCTCC 
TCTCAGAGCC TGAAACGCGC CTGGCGTACA TCTGAGTTAT TTGAACAGGC ATTAGCTGGC 
CATATTGGTA TTCGTACTGG TCGCATTGCT CGTGAGGCGG CGCAAATCCT CGTTGATAGC 
GGCATTGACG CCAAAAAAGC GGTTGAGTAC GTCAAGAACA TCGCCAACTG CTTTGGCAAG 
GTAAAAGAGG ATAAGAAACC CAAAGATGAG TTGACGAATG CTGAAACCGA GCAACTGGTG 
CATATCAGCC CTGCTGAGTT TGAGGCCGTG AAAGCGCTGG CGCGCCGTCT GGCAGAAGAA 
AAACGTCCGG CAACAGAAGA GGAAGCAGAA CTGTTACGTC ACGATCGCAT GGCCGTCGAT 
ATTGCCATGT TTGGCCGGAT GTTAGCGAAG AAAACTGATT TTAACGTGGA AGCCGCCTGC 
CAGGTCGCCC ACGCCTTCGG CGTCAGCGAA ACGATCATCG AAGACGATTT CTTTACCGCT 
GTGGATGACC TACGCCAGGC ATCGGCAGAA GATGCAGGCG CAGGCCATCT CGGCGAAACC 
GGCTTTGGCT CCGCGCTGTT TTACACCTAT ATCTGCATCG ACAAAGATCT GCTGGTGAAA 
AACCTGAACG ACAATGAAGA ACTGGCAAAC AAAACGCTGC GCGCCTTTAC TGAAGCGGCG 
CTGAAAGTGT CGCCGACCGG CAAACAGAAC AGCTTTGCCA GCCGTGCCTA TGCCTCGTGG 
GCGCTGGCCG AAAAAGGCAC CGACCAACCA CGTTCACTGG CGGCCGCGTT TTATGAACCG 
ATCAACGGTA CAGACCAATT GAACGTTGCG GTTAAGCGTA TTACATCGCT GCATAAGAAT 
ATGAATAAGG TTTATGGCCA GCGGACTGAT ACCGCCAGTT TCGACGTGAT GAATCAGCAG 
GGAAGCATGA AAGACGTGCT TGATTTCATC TGCGCGTAA

Protein sequence

MTTFIQLHLL TAYPAANLNR DDTGAPKTVV LGGATRLRIS SQSLKRAWRT SELFEQALAG 
HIGIRTGRIA REAAQILVDS GIDAKKAVEY VKNIANCFGK VKEDKKPKDE LTNAETEQLV 
HISPAEFEAV KALARRLAEE KRPATEEEAE LLRHDRMAVD IAMFGRMLAK KTDFNVEAAC 
QVAHAFGVSE TIIEDDFFTA VDDLRQASAE DAGAGHLGET GFGSALFYTY ICIDKDLLVK 
NLNDNEELAN KTLRAFTEAA LKVSPTGKQN SFASRAYASW ALAEKGTDQP RSLAAAFYEP 
INGTDQLNVA VKRITSLHKN MNKVYGQRTD TASFDVMNQQ GSMKDVLDFI CA