Gene SeHA_C3132 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3132
Symbol	cas1
ID	6489479
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	3053269
End bp	3054189
Gene Length	921 bp
Protein Length	306 aa
Translation table	11
GC content	56%
IMG OID	642743277
Product	CRISPR-associated protein Cas1
Protein accession	YP_002046896
Protein GI	194448225
COG category	[L] Replication, recombination and repair
COG ID	[COG1518] Uncharacterized protein predicted to be involved in DNA repair
TIGRFAM ID	[TIGR00287] CRISPR-associated endonuclease Cas1 [TIGR03638] CRISPR-associated endonuclease Cas1, ECOLI subtype

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	80
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGTTCG TGCCGCTCAA CCCGATCCCG TTAAAAGATC GAACCTCAAT GATCTTCCTC 
CAGTACGGTC AGATTGACGT GCTGGATGGG GCATTCGTGC TGATCGATAA AACGGGAATC 
CGCACGCATA TTCCCGTTGG TTCGGTCGCT TGTATCATGC TGGAACCGGG AACGCGGGTT 
TCCCATGCGG CTGTGCGTCT GGCATCGACG GTGGGAACGC TGTTGGTGTG GGTGGGCGAG 
GCGGGAGTGC GGGTTTATTC CTCCGGACAA CCCGGCGGCG CACGAGCCGA TAAGTTGCTT 
TATCAGGCAA AGCTGGCGTT AGATGATGAC CTGCGGCTGA AGGTGGTGCG CAAAATGTAT 
GAACTGCGTT TTCGCGAACC GCCGCCCGCC CGTCGTTCCG TTGAGCAACT GCGCGGTATT 
GAAGGATCCC GTGTGCGGGC GACCTATGCA TTGCTGGCGA AGCAGTATGG CGTGAAGTGG 
CATGGTCGTA ACTATGATCC GAAAGACTGG GAGAAGGGGG ATGTCGTCAA CCGATGTATT 
AGCGCGGCGA CATCGTGCCT GTACGGGATT TCAGAAGCGG CTATCCTGGC GGCGGGATAT 
GCGCCAGCTA TCGGTTTTAT CCATAGTGGT AAGCCGCTTT CTTTTGTTTA TGACATTGCC 
GATATCATCA AATTTGAATC GGTGGTGCCC AAAGCATTTG AGATCGCTGC TCGTCACCCG 
GCGGAACCTG ATAAAGAAGT GCGCCTGGCC TGCCGTGATA TTTTTCGCAG TTCGAAGCTG 
ACCGGAAAAT TGATCCCACT GATCGAAGAG GTGCTCGCTG CCGGTGAAAT TGAACCACCT 
CAGCCTGCGC CGGATATGTT GCCGCCAGCA ATACCGGAAC CTGAATCACT GGGTGATAGC 
GGCCATCGGG GGCATGGTTG A

Protein sequence

MTFVPLNPIP LKDRTSMIFL QYGQIDVLDG AFVLIDKTGI RTHIPVGSVA CIMLEPGTRV 
SHAAVRLAST VGTLLVWVGE AGVRVYSSGQ PGGARADKLL YQAKLALDDD LRLKVVRKMY 
ELRFREPPPA RRSVEQLRGI EGSRVRATYA LLAKQYGVKW HGRNYDPKDW EKGDVVNRCI 
SAATSCLYGI SEAAILAAGY APAIGFIHSG KPLSFVYDIA DIIKFESVVP KAFEIAARHP 
AEPDKEVRLA CRDIFRSSKL TGKLIPLIEE VLAAGEIEPP QPAPDMLPPA IPEPESLGDS 
GHRGHG