Gene Cyan8802_0521 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_0521
Symbol
ID	8389827
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	-
Start bp	514107
End bp	515084
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	35%
IMG OID	644978548
Product	CRISPR-associated protein Cas1
Protein accession	YP_003136304
Protein GI	257058416
COG category	[L] Replication, recombination and repair
COG ID	[COG1518] Uncharacterized protein predicted to be involved in DNA repair
TIGRFAM ID	[TIGR00287] CRISPR-associated endonuclease Cas1 [TIGR03641] CRISPR-associated endonuclease Cas1, HMARI/TNEAP subtype

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000250956
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000123897
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCAATTC TTTACTTAAC TCAACCCGAT GCTGTTTTAA GCAAAAAACA AGAAGCATTT 
CATGTAGCAC TCAAGCAAGA AGATGGTTCT TGGAAAAAAC AATTAATCCC CGCTCAAACT 
GTTGAACAAA TTGTTTTAAT AGGGTATCCT AGTATTACTG GTGAAGCCTT ATGCTATGCC 
CTTGAATTAG GTATTCCTGT TCATTATTTA TCGTGTTTTG GTAAGTATTT AGGTTCCGCA 
CTTCCTGGTT ATTCTCGTAA TGGACAGTTA CGTTTAGCGC AATATCATGT TCATGACAAT 
GAAGAGCAAA GATTAGCCTT AGTAAAAACT GTAGTTACAG GGAAAATTCA CAATCAATAT 
CACGTTCTCT ATCGTTATCA ACAAAAAGAT AATCCTCTCA AAGAACATAA ACAATTAGTC 
AAATCAAAAA CAACACTAGA ACAAGTAAGA GGGGTTGAAG GATTAGCCGC TAAAGACTAC 
TTTAATGGCT TTAAACTGAT CCTAGATTCT CAATGGAATT TTAATGGTAG AAATCGCCGT 
CCTCCAACTG ATCCAGTGAA TGCTTTGTTA AGTTTTGCCT ATGGTTTATT ACGAGTTCAA 
GTCACTGCGG CTGTTCATAT TGCTGGTTTA GATCCTTATA TTGGTTATTT ACATGAAACC 
ACTCGCGGAC AACCTGCAAT GGTTCTAGAT TTAATGGAAG AATTTCGTCC TTTGATTGCG 
GATAGTTTGG TGTTATCAGT GATTAGTCAT AAAGAAATTA AACCAACAGA TTTTAACGAA 
AGTTTAGGAG CTTATCTTTT ATCAGATTCA GGAAGAAAAA CGTTTTTACA AGCTTTTGAA 
AGAAAATTAA ATACTGAGTT TAAACATCCA GTCTTTGGTT ATCAATGTAG TTATCGACGT 
TCCATTGAAT TACAAGCTCG TTTGTTCAGT CGTTATTTAC AAGAAAATAT TCCCTACAAA 
TCTTTGAGTT TACGATGA

Protein sequence

MSILYLTQPD AVLSKKQEAF HVALKQEDGS WKKQLIPAQT VEQIVLIGYP SITGEALCYA 
LELGIPVHYL SCFGKYLGSA LPGYSRNGQL RLAQYHVHDN EEQRLALVKT VVTGKIHNQY 
HVLYRYQQKD NPLKEHKQLV KSKTTLEQVR GVEGLAAKDY FNGFKLILDS QWNFNGRNRR 
PPTDPVNALL SFAYGLLRVQ VTAAVHIAGL DPYIGYLHET TRGQPAMVLD LMEEFRPLIA 
DSLVLSVISH KEIKPTDFNE SLGAYLLSDS GRKTFLQAFE RKLNTEFKHP VFGYQCSYRR 
SIELQARLFS RYLQENIPYK SLSLR