Gene PCC8801_3940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_3940
Symbol
ID	7103884
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	4125145
End bp	4126506
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	35%
IMG OID	643476939
Product	restriction modification system DNA specificity domain protein
Protein accession	YP_002374040
Protein GI	218248669
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCTAA ATACCCTAAA GCAATGGAAA CCTTACCCAC ATTATAAACC TTCCGGGGTT 
GATTTCTTGG GGGATATTCC TGATGGGTGG GAGGTTAAAA GATTAAAATG GATTGTATCA 
AAAATTGGTA GCGGTAAAAC TCCTAAAGGT GGTGCAGAAA TTTACTCTGA TTCTGGTATT 
ATTTTTTTGC GTAGCCAGAA TATTCATTTT GATGGTTTAA GATTAGATGA CGTTGTTTAT 
ATAAATAAAG ATATTGATAA AGCAATGTCA TCTTCTAGAG TAAAACCGCT TGACATTCTT 
TTAAATATAA CAGGCGCATC TTTAGGGAGA TGTATGATTA TTCCTAAAGA TTTCCCGTCA 
TCTAATGTTA ATCAGCACGT TTGCATTCTT AGACCTATTG TAACCCGTAT CAACCCTTAT 
TTTTTAAATA GAGTAATGTC CTCTAATGCA ATTCAAAATC AAATATTTTC TTCTGAAGTT 
GGTGTTTCCC GTGAAGGTTT AACTTTTGCT CAAGCTGGTA ATTTAATTTC AGTATTTCCC 
TCCCTACCCG AACAAGAAAA AATCGCTCAA TTTCTGGATG AAGAAACCGC GAAAATAGAT 
AAACTCATCA CCCACAAACA AAGACTAATT GAATTATTAA AAGAAAAGCG CACAGCTTTA 
ATTAGTCATG CTGTCACCAA AGGACTTAAC CCCGATGTCC CGATGAAAGA TTCTGGGGTA 
GAATGGTTAG GGTTTATTCC TGAACATTGG GAGGTTAAGA AAATTAAGAG GTTATCCTTA 
GTAAAAAGGG GCGCATCACC TAGACCAATT GACGACCCAA TATATTTTGA TGATAATGGA 
GAATATGTAT GGGTTAGAAT TTCTGATGTA ACAGCTAGTA ATAAATATTT ATTAGAAGCT 
GAACAAAAAT TATCCGAGAT AGGAAAGAGG AAAAGTGTTC CTTTACAACC TAATGAACTA 
TTCTTAAGCA TTTGCGCTAG TGTTGGAAAA CCAATCATTA CCAAAATTAA ATGCTGTATT 
CATGATGGTT TTGTGTATTT TCCAGAATTG AAAGAAAATA GAGAATATTT ATATTATATT 
TTTCTGGGAG GAGAATTATA TAAAGGTTTA GGTAAAATGG GAACACAGTT AAATCTTAAT 
ACGGAGATTA TTGGAGATGT TAAATTACCA ATTCCTCCCG TTTCCGAACA ACAAAAAATC 
GCAGAATACT TAGACGAAAA AACCGAACAA ATAGACCCAA TAATTAAGAA AACCCGTGAG 
AGTATCGAGT ATTTAAAAGA ATATCGAACC GCGTTAATAT CTGCTGCCGT AACAGGTAAA 
ATAGATGTGA GGCAGTGGGG ATGTGAGGAG GTGAGGGAAT GA

Protein sequence

MTLNTLKQWK PYPHYKPSGV DFLGDIPDGW EVKRLKWIVS KIGSGKTPKG GAEIYSDSGI 
IFLRSQNIHF DGLRLDDVVY INKDIDKAMS SSRVKPLDIL LNITGASLGR CMIIPKDFPS 
SNVNQHVCIL RPIVTRINPY FLNRVMSSNA IQNQIFSSEV GVSREGLTFA QAGNLISVFP 
SLPEQEKIAQ FLDEETAKID KLITHKQRLI ELLKEKRTAL ISHAVTKGLN PDVPMKDSGV 
EWLGFIPEHW EVKKIKRLSL VKRGASPRPI DDPIYFDDNG EYVWVRISDV TASNKYLLEA 
EQKLSEIGKR KSVPLQPNEL FLSICASVGK PIITKIKCCI HDGFVYFPEL KENREYLYYI 
FLGGELYKGL GKMGTQLNLN TEIIGDVKLP IPPVSEQQKI AEYLDEKTEQ IDPIIKKTRE 
SIEYLKEYRT ALISAAVTGK IDVRQWGCEE VRE