Gene PCC8801_0504 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_0504
Symbol
ID	7101968
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	515195
End bp	516172
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	34%
IMG OID	643473608
Product	CRISPR-associated protein Cas1
Protein accession	YP_002370751
Protein GI	218245380
COG category	[L] Replication, recombination and repair
COG ID	[COG1518] Uncharacterized protein predicted to be involved in DNA repair
TIGRFAM ID	[TIGR00287] CRISPR-associated endonuclease Cas1 [TIGR03641] CRISPR-associated endonuclease Cas1, HMARI/TNEAP subtype

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAATTC TTTACTTAAC TCAACCCGAT GCTGTTTTAA GCAAAAAACA AGAAGCATTT 
CATGTAGCAC TCAAGCAAGA AGATGGTTCT TGGAAAAAAC AATTAATCCC CGCTCAAACT 
GTTGAACAAA TTGTTTTAAT AGGGTATCCT AGTATTACTG GTGAAGCCTT ATGCTATGCC 
CTTGAATTAG GTATTCCTGT TCATTATTTA TCGTGTTTTG GTAAGTATTT AGGTTCCGCA 
CTTCCTGGTT ATTCTCGTAA TGGACAGTTA CGTTTAGCGC AATATCATGT TCATGACAAT 
GAAGAGCAAA GATTAGCCTT AGTAAAAACT GTAGTTACAG GGAAAATTCA CAATCAATAT 
CACGTTCTGT ATCGTTATCA ACAAAAAGAT AATCCTCTCA AAGAACATAA ACAATTAGTC 
AAATCAAAAA CAACACTAGA ACAAGTAAGA GGGGTTGAAG GATTAGCCGC TAAAGACTAC 
TTTAATGTCT TTAAACTAAT CTTAGATTCT CAATGGAATT TTAATGGTAG AAATCGCCGT 
CCTCCAACTG ATCCAGTGAA TGCTTTGTTA AGTTTTGCCT ATGGTTTATT ACGAGTTCAA 
GTCACTGCGG CTGTTCATAT TGCTGGTTTA GATCCTTATA TTGGTTATTT ACATGAAACC 
ACTCGCGGAC AACCTGCAAT GGTTCTAGAT TTAATGGAAG AATTTCGTCC TTTGATTGCG 
GATAGTTTGG TGTTATCAGT GATTAGTCAT AAAGAAATTA AACCAACAGA TTTTAACGAA 
AGTTTAGGAG CTTATCTTTT ATCAGATTCA GGAAGAAAAA CGTTTTTACA AGCTTTTGAA 
AGAAAATTAA ATACTGAGTT TAAACATCCA GTCTTTGGTT ATCAATGTAG TTATCGACGT 
TCCATTGAAT TACAAGCTCG TTTGTTCAGT CGTTATTTAC AAGAAAATAT TCCCTATAAA 
TCTTTGAGTT TACGATGA

Protein sequence

MSILYLTQPD AVLSKKQEAF HVALKQEDGS WKKQLIPAQT VEQIVLIGYP SITGEALCYA 
LELGIPVHYL SCFGKYLGSA LPGYSRNGQL RLAQYHVHDN EEQRLALVKT VVTGKIHNQY 
HVLYRYQQKD NPLKEHKQLV KSKTTLEQVR GVEGLAAKDY FNVFKLILDS QWNFNGRNRR 
PPTDPVNALL SFAYGLLRVQ VTAAVHIAGL DPYIGYLHET TRGQPAMVLD LMEEFRPLIA 
DSLVLSVISH KEIKPTDFNE SLGAYLLSDS GRKTFLQAFE RKLNTEFKHP VFGYQCSYRR 
SIELQARLFS RYLQENIPYK SLSLR