Gene PCC8801_3551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_3551
Symbol
ID	7102648
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	3699020
End bp	3699937
Gene Length	918 bp
Protein Length	305 aa
Translation table	11
GC content	41%
IMG OID	643476562
Product	histone deacetylase superfamily
Protein accession	YP_002373671
Protein GI	218248300
COG category	[B] Chromatin structure and dynamics [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0123] Deacetylases, including yeast histone deacetylase and acetoin utilization protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCCGC CGATTGTTTA CCATCCCCAA TATGTTGCTC CTATCCCTGA TGAGCATCGC 
TTTCCGATGC TCAAATTTCG ACTACTTTAT GAACTATTAT TATCTGATAG TATTGCTGAA 
CCTAAAAATA TTTATACCCC AGAATTTCCA GAATTAGGTT TAATTGAATT AGTGCATACA 
GCCGAATATA TTAATGCTTA TTGTCAGGGA ACTCTCGATG TAAAATCTCA AAGACGTATC 
GGTTTACCCT GGAGTCAAGA ATTAGTTCAA CGGACGTTAA TTGCGGTAGG TGGGACAATT 
TTAACAGCAA AATTAGCCCT ACAATATGGC TTAGCGAGTA ATACCGCCGG GGGAACTCAT 
CACGCTTTTC CTAATTATGG CTCGGGGTTT TGTATTTTTA ATGATTTAGC GATCGCCTCT 
CGTGTGTTAC AACAATTAGG CTTAGTTAAA AAGGTTCTAA TTGTCGATCT CGATGTCCAT 
CAGGGGGATG GAACGGCTGT CATTTTTGAA AATGATCCGA CTGTGTTTAC ATTTTCTCTC 
CATTGTGAGA GTAATTTTCC TGCGAAGAAA CAACAAAGCG ATCTCGATGT TCCTCTACCT 
GAAGGGTTAG ATGATGACGG TTATCTGCAA ATTTTAGCGC AATATTTACC CGATTTATTG 
TCTCATGTTA AACCCGATTT AGTCCTATAT GATGCGGGAG TCGATACCCA TGTTAGCGAT 
CGCTTAGGAA AACTCGCTTT GACGGATAGG GGGTTATACC GTCGAGAAAT GCAGGTATTA 
AGTACTTGTG TGGCCGCAGG GTATCCAGTG GCTAGTGTTA TTGGAGGCGG TTATACTAAA 
GATCTAAAGA AACTGGTATA TCGACATTCT TTGCTCCATC GCGCTTCACG GGATGTTTAT 
CAACAATACC GTCCTTAG

Protein sequence

MNPPIVYHPQ YVAPIPDEHR FPMLKFRLLY ELLLSDSIAE PKNIYTPEFP ELGLIELVHT 
AEYINAYCQG TLDVKSQRRI GLPWSQELVQ RTLIAVGGTI LTAKLALQYG LASNTAGGTH 
HAFPNYGSGF CIFNDLAIAS RVLQQLGLVK KVLIVDLDVH QGDGTAVIFE NDPTVFTFSL 
HCESNFPAKK QQSDLDVPLP EGLDDDGYLQ ILAQYLPDLL SHVKPDLVLY DAGVDTHVSD 
RLGKLALTDR GLYRREMQVL STCVAAGYPV ASVIGGGYTK DLKKLVYRHS LLHRASRDVY 
QQYRP