Gene SeAg_B3066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B3066
Symbol	cas1
ID	6795440
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	-
Start bp	2989621
End bp	2990541
Gene Length	921 bp
Protein Length	306 aa
Translation table	11
GC content	55%
IMG OID	642777227
Product	CRISPR-associated protein Cas1
Protein accession	YP_002147836
Protein GI	197248534
COG category	[L] Replication, recombination and repair
COG ID	[COG1518] Uncharacterized protein predicted to be involved in DNA repair
TIGRFAM ID	[TIGR00287] CRISPR-associated endonuclease Cas1 [TIGR03638] CRISPR-associated endonuclease Cas1, ECOLI subtype

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACGTTCG TACCGCTCAA CCCGATCCCG TTAAAAGATC GAACCTCGAT GATCTTCCTC 
CAGTACGGTC AAATTGACGT GCTGGATGGG GCATTCGTGC TGATCGATAA AACGGGAGTC 
CGCACGCACA TTCCCGTCGG TTCGGTCGCT TGTATCATGC TGGAACCGGG AACGCGGGTT 
TCCCATGCGG CAGTGCATTT AGCATCAACG GTCGGCACCC TGTTGGTATG GGTGGGCGAG 
GCGGGAGTGC GGGTCTATTC CTCCGGACAA CCCGGTGGCG CACGAGCCGA TAAGTTGCTT 
TATCAGGCAA AGCTGGCGTT AGATGATGAC CTGCGGCTTA AAGTAGTCCG CAAAATGTAT 
GAACTGCGTT TTCGTGAGCC GCCTCCCGCC CGTCGTTCCG TTGAGCAACT GCGCGGTATT 
GAAGGATCCC GTGTGCGGGC GACCTATGCA TTACTGGCGA AGCAGTATGG CGTGAAATGG 
CATGGTCGTA ACTACGATCC GAAAGACTGG GAGAAGGGGG ATGTCGTCAA CCGATGTATT 
AGCGCGGCGA CATCGTGCCT GTACGGGATT TCAGAAGCGG CTATCCTGGC GGCGGGCTAT 
GCGCCAGCTA TCGGTTTTAT CCATAGCGGT AAGCCGCTTT CTTTTGTTTA TGACATTGCC 
GATATCATCA AATTTGAATC GGTGGTGCCC AAAGCATTTG AGATCGCCGC TCGTCACCCG 
GCGGAACCTG ATAAAGAAGT GCGCCTGGCC TGCCGGGATA TTTTTCGCAG TTCGAAGCTG 
ACCGGAAAAT TGATCCCACT GATCGAAGAG GTACTCGCTG CCGGTGAAAT TGAACCCCCT 
CAGCCTGCGT CGGATATGCT GCCGCCAGCA ATACCGGAAC CTGAATCACT GGGTGATAGC 
GGCCATCGGG GGCATGGTTG A

Protein sequence

MTFVPLNPIP LKDRTSMIFL QYGQIDVLDG AFVLIDKTGV RTHIPVGSVA CIMLEPGTRV 
SHAAVHLAST VGTLLVWVGE AGVRVYSSGQ PGGARADKLL YQAKLALDDD LRLKVVRKMY 
ELRFREPPPA RRSVEQLRGI EGSRVRATYA LLAKQYGVKW HGRNYDPKDW EKGDVVNRCI 
SAATSCLYGI SEAAILAAGY APAIGFIHSG KPLSFVYDIA DIIKFESVVP KAFEIAARHP 
AEPDKEVRLA CRDIFRSSKL TGKLIPLIEE VLAAGEIEPP QPASDMLPPA IPEPESLGDS 
GHRGHG