Gene PCC8801_3059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_3059
Symbol
ID	7105442
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	3200689
End bp	3201747
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	41%
IMG OID	643476083
Product	A/G-specific adenine glycosylase
Protein accession	YP_002373196
Protein GI	218247825
COG category	[L] Replication, recombination and repair
COG ID	[COG1194] A/G-specific DNA glycosylase
TIGRFAM ID	[TIGR00586] mutator mutT protein [TIGR01084] A/G-specific adenine glycosylase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTTTAC GGCGATCGCT TCTATTATGG TATCAGCATC AGGGACGAGA GTTACCCTGG 
AGAAATATCG ATGATCCCTA TGCTATCTGG GTTTCGGAGA TTATGCTGCA ACAAACCCAG 
GTTAAGACTG TTATTCCCTA TTATCAGCGA TGGTTAGCAC AATTTCCTAA TATTCAAACA 
TTAGCAACCT CTGACTTGCA AACTGTTCTC AAGGCTTGGG AAGGCTTAGG CTATTATACC 
CGTGCGCGAA ATCTTTATAA AACGGCTCAG ATTATTTTAA AGGATTACAG GGGAATTTTT 
CCCAGAGAGT TAGAAAAAGT CGTAAAATTG CCAGGAATTG GACGAACGAC GGCTGGAGGC 
ATCCTCAGTT CAGCGTTTAA TCAACCAATC TCTATTTTAG ATGGTAACGT CAAGCGAGTG 
TTAGCAAGAT TAGTTGCCCT TAGCGATCCT CCTGCAAAAG CGATACAATT TTTATGGGAC 
GTATCGGATA GTTTACTCGA TCCCGACAAT CCTAGGGATT TTAACCAAGG GTTGATGGAT 
TTAGGGGCAA CCATTTGCAC CCGAAGTCAG CCAAAATGTT TATTGTGTCC CTGGTTATCC 
CACTGTCAAG CTTATCAACA AGGAAAACAA AATCAACTCC CCATGCGTGA AGATTCCTCT 
CCCTTACCCC ACAAAAAAAT TGGTGTTGCA GTGATTTATA ATAATGCAGG AGAAATCTTG 
ATTGATCGCC GTCCCGATAA AGGATTATTA GGAGGGTTAT GGGAATTTCC TGGGGGAAAG 
ATTGAAGAAA ATGAAACGGT AGAAGAGTGT ATTAAACGAG AAATTTTAGA AGAAATTGCC 
ATTGATATCG AAGTGGGAGA ACATTTAATT ACCCTCGATT ATGCCTATAC TCATTTTAAA 
GTCACTTTAA TTGTTCATCT GTGTCGTCAT GTTGCTGGAG AACCCCAAGC GATCGAATGT 
CAAGAAATTC GCTGGACAAC CTTAGATGAA ATTGATAGTT TTCCGTTTCC TAAAGCCAAT 
AGTAAGATTA TCGAAGCTTT AAGAAACAAT CAACCATAA

Protein sequence

MALRRSLLLW YQHQGRELPW RNIDDPYAIW VSEIMLQQTQ VKTVIPYYQR WLAQFPNIQT 
LATSDLQTVL KAWEGLGYYT RARNLYKTAQ IILKDYRGIF PRELEKVVKL PGIGRTTAGG 
ILSSAFNQPI SILDGNVKRV LARLVALSDP PAKAIQFLWD VSDSLLDPDN PRDFNQGLMD 
LGATICTRSQ PKCLLCPWLS HCQAYQQGKQ NQLPMREDSS PLPHKKIGVA VIYNNAGEIL 
IDRRPDKGLL GGLWEFPGGK IEENETVEEC IKREILEEIA IDIEVGEHLI TLDYAYTHFK 
VTLIVHLCRH VAGEPQAIEC QEIRWTTLDE IDSFPFPKAN SKIIEALRNN QP