Gene PCC7424_1718 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC7424_1718
Symbol
ID	7108599
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 7424
Kingdom	Bacteria
Replicon accession	NC_011729
Strand	+
Start bp	1893173
End bp	1894150
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	39%
IMG OID	643479980
Product	CRISPR-associated protein Cas1
Protein accession	YP_002377021
Protein GI	218438692
COG category	[L] Replication, recombination and repair
COG ID	[COG1518] Uncharacterized protein predicted to be involved in DNA repair
TIGRFAM ID	[TIGR00287] CRISPR-associated endonuclease Cas1 [TIGR03641] CRISPR-associated endonuclease Cas1, HMARI/TNEAP subtype

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	3.07332e-23
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCAGTTT TATATATCAC TCAACCTGAT GGGGTTTTAA GTAAAAAACA AGAGGCGTTT 
AATGTGGCTC TAAAACAGGA GGATGGCTCT TGGCAAAAAC AATCTATTGC GGCTCAAACG 
GTTGAACAAA TTGTTTTAAT TGGGCAACCG AGTATTACGG GAGAAGCTCT AAGTTATGCT 
CTAGAGTTAG GGATTCCGGT TCATTATTTG TCGAGTTTCG GGAAATATTT AGGCTCGGCA 
TTGCCGGGAT TTTCTCGGAA TGGACAGTTA AGATTAGCTC AGTATGCTGT TCATAATGAT 
AATGATAAAA GGTTGGCTTT GGTAAAAACA ATTGTCAGGG GGAAAATTCA TAATCAGTAT 
CGCCTTCTCT ACCGTTATGG ACAGAACCAA AATTCCCTCA AATTACGTAA AAAATCGGTG 
CAAAATCAAT CCAATTTAAA TCAAGTTCGA GGAGTTGAAG GGATAGCAGC TAGAGAATAT 
TTTCAAGAAC TTTCTAATAT TTTAGAAGAC CAATGGAAAT TTAATGGCAG AAATCGCCGC 
CCTCCAAGAG ATCCGATTAA TGCGTTATTG AGTTTTGCTT ATGGATTATT GCGAGTACAA 
GTAACGGCGG CGGTTCATTT AGCCGGTTTA GATCCTTACA TTGGTTATCT TCATGATACG 
ACTAGAGGAC AACCGGCGAT GGTGTTAGAT TTGATGGAAG AATTTCGCCC TTTGATTGCT 
GATAGTTTGG TGTTGTCTAT TATCAGTCAT AAGGAAATTA ACGCTGATGA TTTTGAGGAA 
AGTTTAGGCG CTTATCGTTT GCTAGATGGG GGAAGGAAAG CTTTTTTACA AGGGTTTGAA 
CGAAAGATGT CTTCGGAGTT TAAACATCCT TTGTTTGGTT ATCAGTGTAC TTATCGTCGG 
GCGGTGGAAT TACAAGCTCG TTTGTTAAGT CGTCATCTCC AAGAAGAAGT TCCTTATCAA 
TCTTTTAGAA TCCGATGA

Protein sequence

MSVLYITQPD GVLSKKQEAF NVALKQEDGS WQKQSIAAQT VEQIVLIGQP SITGEALSYA 
LELGIPVHYL SSFGKYLGSA LPGFSRNGQL RLAQYAVHND NDKRLALVKT IVRGKIHNQY 
RLLYRYGQNQ NSLKLRKKSV QNQSNLNQVR GVEGIAAREY FQELSNILED QWKFNGRNRR 
PPRDPINALL SFAYGLLRVQ VTAAVHLAGL DPYIGYLHDT TRGQPAMVLD LMEEFRPLIA 
DSLVLSIISH KEINADDFEE SLGAYRLLDG GRKAFLQGFE RKMSSEFKHP LFGYQCTYRR 
AVELQARLLS RHLQEEVPYQ SFRIR