Gene YpsIP31758_1535 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_1535
Symbol	cas1
ID	5387381
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	+
Start bp	1788553
End bp	1789533
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	48%
IMG OID	640864517
Product	CRISPR-associated protein Cas1
Protein accession	YP_001400513
Protein GI	153949474
COG category	[L] Replication, recombination and repair
COG ID	[COG1518] Uncharacterized protein predicted to be involved in DNA repair
TIGRFAM ID	[TIGR00287] CRISPR-associated endonuclease Cas1 [TIGR03637] CRISPR-associated endonuclease Cas1, YPEST subtype

Plasmid Coverage information

Num covering plasmid clones	49
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAACG CTATTCATTC CTCTGATTTG AAAACGATCC TGCATTCAAA ACGATCCAAT 
ATTTACTATT TAGAATATTG CCGCGTATTG GTTAATGGTG GGCGAGTTGA ATATGTCACC 
GATGAAGGTA AACAATCCCT TTACTGGAAT ATCCCCATAG CGAACACCAC CGTTATTATG 
CTGGGAACCG GGACTTCGGT GACTCAGGCT GCTATGCGTG AGTTTGCCCG AGCCGGGGTC 
TTAGTCGGTT TTTGTGGCGG GGGTGGGACG CCGCTTTTTG CGGCTAATGA CGTAGAGGTC 
AATGTCTCGT GGCTCACTGC ACAAAGCGAA TACCGGCCAA CCGAGTATCT GCACGATTGG 
GTCAGTTTCT GGTTCGATGA TGAAAAAAGA CTGGCAGCAG CAGTGGCTTT CCAGCGCATC 
AGGATCGCCC AAATTCAACA ACATTGGCTC AGCAGCCACA TACAGCGCGA ATCTCTTTTT 
CCGGTTAATC ACGATCAATT ATTATTTATC CTCAGCCGTT TTGAGCAAAA TTTAGCAAAT 
TGTCTCACCA GTAATGACCT TATGGTTCAG GAAGCGGTAT TAACAAAGGC ACTCTATAAA 
CTGGCTGCTA ATACAGTGAA TTACGGCGAT TTCACCCGCG CTAAACGCGG TGGGGGCATC 
GATCTAGCTA ATCGTTTTCT CGATCACGGA AATTATCTCG CCTATGGCTT AGCTGCGACG 
GCGACATGGG TTATTGGCTT ACCCCATGGT CTGTCTGTTT TACACGGTAA GACCCGGCGT 
GGTGGTTTGG TCTTTGATGT GGCCGATTTA ATTAAAGATG CGCTAGTGCT ACCGCAGGCA 
TTTATTGCCG CCATGCAGGG AGAAGAAGAA CAAGAATTTC GTCAGCGCTG CATTAGCGGG 
TTTCAACGAA CCGAAGCGCT GGATGTGATG ATTGATGGAA TAAAAGAAAC GGCAGCGTTA 
TGTAGCCAGG TTCCGCGATG A

Protein sequence

MENAIHSSDL KTILHSKRSN IYYLEYCRVL VNGGRVEYVT DEGKQSLYWN IPIANTTVIM 
LGTGTSVTQA AMREFARAGV LVGFCGGGGT PLFAANDVEV NVSWLTAQSE YRPTEYLHDW 
VSFWFDDEKR LAAAVAFQRI RIAQIQQHWL SSHIQRESLF PVNHDQLLFI LSRFEQNLAN 
CLTSNDLMVQ EAVLTKALYK LAANTVNYGD FTRAKRGGGI DLANRFLDHG NYLAYGLAAT 
ATWVIGLPHG LSVLHGKTRR GGLVFDVADL IKDALVLPQA FIAAMQGEEE QEFRQRCISG 
FQRTEALDVM IDGIKETAAL CSQVPR