Gene PCC8801_3935 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_3935
Symbol
ID	7103881
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	4121345
End bp	4123375
Gene Length	2031 bp
Protein Length	676 aa
Translation table	11
GC content	37%
IMG OID	643476934
Product	N-6 DNA methylase
Protein accession	YP_002374035
Protein GI	218248664
COG category	[V] Defense mechanisms
COG ID	[COG0286] Type I restriction-modification system methyltransferase subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAATT TTGGCGAGAA AGTCAGCTTT ATTTGGTCGG TAGCGGATTT AATTCGTGAT 
AGTTTTAAGC GAGGGAAGTA TCAGGATGTA ATTTTGCCGT TTACGGTGTT ACGTCGGTTA 
GATTGCGTGT TAGAACCGAC AAAGGAGCAG GTTTTAGAGG CTTATCATAA ATATCATGGT 
AAATTAGAGA ATCTTGACCC GATTTTGTGT AAACAGTCAG GATTTGCTTT TTATAATGCG 
TCTAACTATG ATTTTGGTAA GTTAATTGAT GACCCGAAGG ATTTGGGAGC AAATTTAAAG 
AAATATATTA ACAGTTTTAG TTCTAATATG CGGGAAGTTT TAGAAAAGTT TGACTTTCCC 
AATACCATTG ATAAGTTAGA GGAAGCGGAT TTATTATTTC AAGTGATGGA GAAGTTTAAG 
ACAATTGATC TTCATCCTGA TAAGGTTTCT AATTTGGAGA TGGGGTATAT TTTTGAGGAG 
TTAATTCGTA AGTTTAATGA AGCATTAGAC GAAAATCCAG GGGAACACTT TACTCCTAGA 
GAAGTAATCA GATTAATGGT GAGTTTATTA TTATCTCAGG ATAAGGATTC TCTTAAACAA 
GCGCATATTA CTCGAACCAT TTATGACCCT TGTTGTGGTA GCGGTGGGAT GTTAACCATA 
GCTAAAGAAA GAATTTTAGA GTTAAATCCC AATGCGACGG TATTTTTATT TGGACAAGAG 
GTCAACCCTG AAACCTTTGC TATTTGTAAG TCAGATTTAT ACATGAAAAG TGAGGACGGA 
AAGGACGCTG ATAATATTAA GTTTGGGAGT ACGTTATCCA ATGACCAACA TAGTGATAAA 
AGCTTTGATT ATTTATTAGC TAATCCTCCC TATGGTAAGG ACTGGAAACG GGATAAGGAT 
GCGGTAGAAA CGGAAGCACA AAAAACAGGA AGTCGCTTTA GTGCAGGAAC TCCGAGAATT 
AGTGATGGAC AGTTATTATT TTTACAGCAA ATGTTAGCAC GGATGAAGTC TCCTGAGAAT 
GGAGGAAGTC GGGTAGCTAT TGTTATGAAT GGTTCACCTT TGTTTACGGG AGATGCAGGA 
AGCGGAGAGA GTGAGATTAG AAGATGGATA TTAGAAAATG ATTGGTTAGA AGCGATTATC 
GCTTTACCTG AACAGTTATT TTATAATACG GGAATTTCTA CCTATATTTG GATATTAAGC 
AATAAGAAAT TACTGCAAAA AAAGGAGAAA GTTCAGTTAA TTAATGGGTC TGATTTTTGG 
GTAGCGATGC GAAAAAGTTT AGGGGATAAG CGTCGGGAAA TTAGCACAGA ACATATTGAG 
AAAATAACCG CTATCTTTCA AGACTTTGAA GTATCAGAGG TAAGTAAGAC TTTTAATAGT 
ACAGATTTTG GGTATCGTAA AATCACGATT GAACGTCCTT TGCGCTTGAA TTTTCAAGTC 
ATACCCGAAA GAATTGAACG GGTAAAGGAA CAAACGGCGT TTATTAATTT AGCAGTGAGT 
AAGAAGAAAA ACCCAGAAAT GAGAAAGATA GAAGAAGACG CAGGAAGAGA ACAACAAAAG 
TTAATTTTAG GGGTTTTAAA TGGTTTATCA GATGAGTTAT ACAAAGACCG TAAACCGCTT 
GAATTGTTAT TAAAAAAGGC GTTTAAAGTA GAGAATGTGG CGGTTAAAGG GGCATTATTT 
AAGGCGATAT TAACGGGGTT ATCAGAGAAA GATGAAACCG CAGAAATTTG TCGAGATAAA 
GACGGAAATC CTGAACCCGA TACGGAGTTA AGAGACACAG AAAATGTGCC GTTAGATGAG 
GATATTTATG ATTATTTTGA ACGGGAAGTT AAACCCCATG TTTCTGATGC GTGGATTAAT 
GAAACAGTGA GGGATAGTAA GGATAGTGGG GTAGGGAAAG TGGGTTATGA GATTAATTTT 
AATCGTTATT TTTATCAGTA TCAACCCCCA AGAGAGTTAT CAGAAATAGA AAAGGATATT 
CAGCAAGTAG AGGGAGAAAT TTTAGCGATG CTGAAGGAGA TGAGAGAGTG A

Protein sequence

MQNFGEKVSF IWSVADLIRD SFKRGKYQDV ILPFTVLRRL DCVLEPTKEQ VLEAYHKYHG 
KLENLDPILC KQSGFAFYNA SNYDFGKLID DPKDLGANLK KYINSFSSNM REVLEKFDFP 
NTIDKLEEAD LLFQVMEKFK TIDLHPDKVS NLEMGYIFEE LIRKFNEALD ENPGEHFTPR 
EVIRLMVSLL LSQDKDSLKQ AHITRTIYDP CCGSGGMLTI AKERILELNP NATVFLFGQE 
VNPETFAICK SDLYMKSEDG KDADNIKFGS TLSNDQHSDK SFDYLLANPP YGKDWKRDKD 
AVETEAQKTG SRFSAGTPRI SDGQLLFLQQ MLARMKSPEN GGSRVAIVMN GSPLFTGDAG 
SGESEIRRWI LENDWLEAII ALPEQLFYNT GISTYIWILS NKKLLQKKEK VQLINGSDFW 
VAMRKSLGDK RREISTEHIE KITAIFQDFE VSEVSKTFNS TDFGYRKITI ERPLRLNFQV 
IPERIERVKE QTAFINLAVS KKKNPEMRKI EEDAGREQQK LILGVLNGLS DELYKDRKPL 
ELLLKKAFKV ENVAVKGALF KAILTGLSEK DETAEICRDK DGNPEPDTEL RDTENVPLDE 
DIYDYFEREV KPHVSDAWIN ETVRDSKDSG VGKVGYEINF NRYFYQYQPP RELSEIEKDI 
QQVEGEILAM LKEMRE