Gene PCC8801_2214 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_2214
Symbol
ID	7102459
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	2289667
End bp	2291040
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	30%
IMG OID	643475269
Product	restriction modification system DNA specificity domain protein
Protein accession	YP_002372398
Protein GI	218247027
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAAAT CAAAAAATAC TCAATTAGAA CTTAATTTGT GTTTAGAGGA TGAAAACTCT 
GGACATGAAA ATAAAATTTT AGCTCGTGAT TTTCCTCCTG AATGGCAATT AATACCACTT 
AAAAATGCTG TAACTTATAT TGATTATGGT TATTCTCACT CAATTCCTAA AATACCTCCT 
GAAAATGGAA TAAAAATTGT TAGTACAGCA GATATTAGTA AAACAGGAGA GTTGTTATAT 
TCACAAATTA GAAAAGTTGA AGCCCCTTTA AAAACTATAC AACGATTAAC TTTACATGAT 
GGAGATGTTT TATTTAATTG GCGCAATAGT TCTTATTTAA TTGGCAAAAC AACTATTTTT 
GAAGAACAAT CAGAACCTCA TATATTTGCT TCTTTTGTTC TTAGACTGAA ATGTGATGAA 
ATAAAATCAC ATAACTATTT TTTCAAATAC TTATTAAATT ACTATCGCTA TTCTGGAATT 
TTTGAAAGTC TTGCTAGAAG GGCAGTTAAT CAAGCTAATT TTAATAAAAA TGAAGTATCA 
GATTTAATTA TTCCCCTTCC CCCAATAGAA GAACAGCGAA AAATCGCCAG TGTATTAACA 
TTAATACAAG AAGCCATCCA AGAACAAGAA AATGCGATCG CTTTAACAAC GGAACTCAAA 
AAAGCCCTTA TGCAAAAGCT ATTCACCGAA GGAATTAATA ATGAACCGCA GAAAATGACG 
GAAATTGGTC TTATTCCTGA GAGTTGGGAG GTTGTGAATT TAGGTAACCT GGCAAAATTA 
AAATCGGGTG GTACTCCAAG CAGAAAAAAA ATAGAATATT GGGAAAATGG TTCTATTCCT 
TGGGTAAAAA CAACTGAAAT TAATTATGAT TTAATAACCA CAACGGAAGA ATATATAACG 
AAAGAAGGAC TGGTAAATTC TTCAGCAAAA ATGTTTTCTA AAGGTACTTT GTTAATGGCA 
ATGTATGGAC AAGGTGTAAC AAGAGGACGA GTAGGAATTC TTGATATTGA TGCTACTACT 
AATCAAGCTT GTGTTGCTAT TATGCCTAAT TCAGAGGATA AATTATCAAC TAAATTTCTG 
TATCATTATT TTTCCTATCA CTATGAAAAA TTAAGAAATC AAGGACATGG TGCAAATCAA 
AGTAACTTAA GTTCTACTAT TCTAAAAATG TTTCCTATTA CATTCCCTAA AATACAAGAA 
CAATTAATAA TTATTAATCA TTTTGATACA TTAAATTTAA AACTAGAGCA ATCTCATAAA 
AGAATAACTA TTTTACAAGA CTTATTTAGT ACCCTATTAC ATCAATTAAT GACCGCACAA 
ATACGGGTAG ATGAACTAGA GTTATCAGTC TTAGAAAAGC AAATTAAGGA GTAA

Protein sequence

MNKSKNTQLE LNLCLEDENS GHENKILARD FPPEWQLIPL KNAVTYIDYG YSHSIPKIPP 
ENGIKIVSTA DISKTGELLY SQIRKVEAPL KTIQRLTLHD GDVLFNWRNS SYLIGKTTIF 
EEQSEPHIFA SFVLRLKCDE IKSHNYFFKY LLNYYRYSGI FESLARRAVN QANFNKNEVS 
DLIIPLPPIE EQRKIASVLT LIQEAIQEQE NAIALTTELK KALMQKLFTE GINNEPQKMT 
EIGLIPESWE VVNLGNLAKL KSGGTPSRKK IEYWENGSIP WVKTTEINYD LITTTEEYIT 
KEGLVNSSAK MFSKGTLLMA MYGQGVTRGR VGILDIDATT NQACVAIMPN SEDKLSTKFL 
YHYFSYHYEK LRNQGHGANQ SNLSSTILKM FPITFPKIQE QLIIINHFDT LNLKLEQSHK 
RITILQDLFS TLLHQLMTAQ IRVDELELSV LEKQIKE