Gene PCC8801_2988 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_2988
Symbol
ID	7104423
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	3084485
End bp	3085645
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	32%
IMG OID	643476017
Product	restriction modification system DNA specificity domain protein
Protein accession	YP_002373132
Protein GI	218247761
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGATG AATCGCAGAA GTTTATTAAA CTTGGTAACT TGATCAAGTT TAAATATGGA 
AAATCTCTAC CGAATAGAGA AAGAGATCCA GATGGAAAAT ATTTAGTCTT TGGATCTGGT 
GGTAAAATAG GATTACACAA TAGCTATTTA ACTGAATCAC CTGTAATTGT TGTTGGACGA 
AAAGGTTCAA TTGGTTCAAC TTTTTATTCG GATAATCCTT GTTGGTGTAT AGATACAACT 
TACTATGTAG ATCAATTTTC TTCTAATTTA TATTCCAAAT ATTTATATTA TTTTCTCAAT 
ACTTTAAAAT TAGATCGTCT GAATCGCGCA GCAACAATTC CCGGATTAAG TAGAGATGAT 
TTATATACTT TTTCTATCCC TATTCCCTAT CCCAATAATC CTAAACTCTC CTTAGATATA 
CAACAGCGAA TTGTAGCGAG AATTGAATCT TTATTCGGGG AAATTAAACG GAATCGTTTA 
TTACTTGAAC AAATGCGTTT GGATAATGAT TTGTTGTTAC CTAATGCTTT AGATGAAGTG 
GTTGAAAGAT TAGATTCCAA AAGACAAACG CTACTTGATG TTATTCAAGA AAAACCGAGA 
AATGGATGGT CGCCAAAATG CGATAATGAT CCTAATGGTG TTCCTGTCTT AAAATTAGGT 
GCAGTTTTAC GATTTCAGTA TAACCCAGAT GAGATAAAAC GAACTAGCTT ACCGACTGAT 
GAAAATGCAC ATTACTGGTT AGAAGCAGGA GACATTTTAA TCTCTAGAAG TAATACTCTT 
GATTTAGTGG GTCATGCGTC AATTTATTCT GGTATTCCTT ATCCTTGTAT TTATCCAGAT 
TTAATAATGC GTTTTAGAGT GAATCCCAAC AAAGCAGATA GTAAATTCTT AATGTATTGG 
TTACAATCAA AAGAAGTTCG TCATTATATA CAAACGAATG CTTCAGGTGC AAGTCCAACT 
ATGAAGAAAA TCAAACAAGA GACTGTTTGT AATATTCCTT TTCCTATCAT TTCTTTAGAA 
GAACAAAGTT ATTTTGCTTA TCACTTAGAT GCTATTCAAC AAGAAGTGAA TAAAATCAAT 
AGAATAATAG AAGAAGATGA ACAAAACTTT AAGTATTTAG AACAAGCAAT TTTAGAAAAA 
GCATTTAGGG GGGAATTGTA A

Protein sequence

MSDESQKFIK LGNLIKFKYG KSLPNRERDP DGKYLVFGSG GKIGLHNSYL TESPVIVVGR 
KGSIGSTFYS DNPCWCIDTT YYVDQFSSNL YSKYLYYFLN TLKLDRLNRA ATIPGLSRDD 
LYTFSIPIPY PNNPKLSLDI QQRIVARIES LFGEIKRNRL LLEQMRLDND LLLPNALDEV 
VERLDSKRQT LLDVIQEKPR NGWSPKCDND PNGVPVLKLG AVLRFQYNPD EIKRTSLPTD 
ENAHYWLEAG DILISRSNTL DLVGHASIYS GIPYPCIYPD LIMRFRVNPN KADSKFLMYW 
LQSKEVRHYI QTNASGASPT MKKIKQETVC NIPFPIISLE EQSYFAYHLD AIQQEVNKIN 
RIIEEDEQNF KYLEQAILEK AFRGEL