Gene Cyan8802_3132 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_3132
Symbol
ID	8392464
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	+
Start bp	3204737
End bp	3206011
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	33%
IMG OID	644981077
Product	restriction modification system DNA specificity domain protein
Protein accession	YP_003138807
Protein GI	257060919
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.474681
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGTAG AAGGTTGGAA AGATAGTAGT TTGATTTCCC TCTTGACAAT ACTTAAGTCT 
GGAGGGACAC CAAATACATC ACGAAGCGAT TTTTATAATG GTGATATTCC TTTTGTTGCA 
ATTGAAGATA TGAGTGCTAG TAGAAAATAT TTATACAGCA CTGTTAAAAG TTTAACAAAA 
GAAGGCTTAA AAAATTCTAA CGCTTGGTTA GTCCCTGAAA ATTCCTTACT GTATTCTATA 
TACGCAACTC TTGGACTTGT TCGTATTAAT AAGATACCTG TAGCTACTAA TCAAGCTATA 
TTAGCAATGA TTGTAAACGA TGAGGTGGTT GATCAAGATT ATCTCTATTA TTGGTTAGAA 
TATATTCGTG ATTCTATTGT TAATTTATCG GCTCAAACAA CACAAAGTAA TTTAAGTGCC 
ACTACTGTTA AGCCTTTTTT AGTTCAGCAT CCTAAAGATA AAGAAGAACA AACCCAAATA 
GCCACTATCC TCTCAACAAT AGACCGCGCT ATTGAACAAA CCGAAACTTT GATCGCTAAA 
CAACAGCGCA TTAAAACGGG ACTAATGCAG GATTTACTAA CAAAAGGTAT TGATGAAAAT 
GGTAATATTC GCAGCGAAGA AACCCATCAA TTTAAGGATT CAGTTTTAGG TAGGATTCCT 
GTTGAGTGGG AGGTGAAACC TTTAGGTGAA AAAGCAAGGG TAAGATCAGG ATCTACTCCT 
TTACGATCTA ATGAAAAATT TTGGATAGGG GGGACAGTTT CTTGGGTTAA AACCTCTGAA 
GTTTGTTTTT CCAAAATAAC AGAAACAGAA GAAAAAATTA CAGAGCAAGC ATTAAAATTG 
ACCTCTTTGA ATTTAGAACC TATTGGTAGT GTATTGGTAG CTATGTATGG ACAAGGTGGA 
ACTAGAGGAA GATGCGCTAT TTTAGGCATT GAAGCAACAA CTAATCAAGC TTGTGCTGCA 
ATTCTAGGAC AGCAAGGAGA AATCAATCAA GACTATTTAT TTTATTATTT ATCTTCTAAA 
TATAATGATT TACGAACAAT AGGACATGGA TCAAACCAAA CTAACTTAAA CGGTAATTTA 
TTAAGATTAT TTCTTATTAA AGTTCCATCC TATAAGGAAC AAGTTAAAAT TGCTGACTCT 
TTCAATAAAT TAAAACAGAT GCAAGATCAG CTTTTTTCGG AATTATCAAA GTTAAATAGT 
ATAAAAACCG GCCTTATGCA AGATCTTTTA ACTGGCAAAG TTAGGGTAAC AGAATTACTT 
AAAGAAACAG ATTGA

Protein sequence

MSVEGWKDSS LISLLTILKS GGTPNTSRSD FYNGDIPFVA IEDMSASRKY LYSTVKSLTK 
EGLKNSNAWL VPENSLLYSI YATLGLVRIN KIPVATNQAI LAMIVNDEVV DQDYLYYWLE 
YIRDSIVNLS AQTTQSNLSA TTVKPFLVQH PKDKEEQTQI ATILSTIDRA IEQTETLIAK 
QQRIKTGLMQ DLLTKGIDEN GNIRSEETHQ FKDSVLGRIP VEWEVKPLGE KARVRSGSTP 
LRSNEKFWIG GTVSWVKTSE VCFSKITETE EKITEQALKL TSLNLEPIGS VLVAMYGQGG 
TRGRCAILGI EATTNQACAA ILGQQGEINQ DYLFYYLSSK YNDLRTIGHG SNQTNLNGNL 
LRLFLIKVPS YKEQVKIADS FNKLKQMQDQ LFSELSKLNS IKTGLMQDLL TGKVRVTELL 
KETD