Gene GSU1222 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1222
Symbol
ID	2685273
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	1326135
End bp	1327292
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	61%
IMG OID	637125896
Product	histone deacetylase/AcuC/AphA family protein
Protein accession	NP_952275
Protein GI	39996324
COG category	[B] Chromatin structure and dynamics [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0123] Deacetylases, including yeast histone deacetylase and acetoin utilization protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0627011
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCCAGCCA GAACAGCCCT CATATACTCG AACGATTTCG CCCGGTTCAG CTACGGCGAC 
GATCACCCGT TCAAGATCCA GCGTTTCATT CTCGCCTTTG AGCTCATGCG CGCCTATGGC 
CTCATGGAGC TTCCGAACGT CAAAATCCTC GACTGCCCCC GAGCTGCGGA AGAGGCACTG 
CTTACCTTTC ACGCGCCCGA CTATCTCGAT CGTCTCAGGG AATTCAGCGA GTCGGACGAT 
GCCCGCGCCG ATTTCCGGTA CGGTCTCGGC GATCTGGACA ACCCGGTTTT CCGGGGGCTC 
TACGACTGGG CACGGCTGGG TGCCGGAGGG ACCATCGAGG CGGCCCGGCT GGTTGCCGAG 
GAGGGCTATG ACATCGCCTT CAATCTTGCG GGGGGGTGGC ATCACGCCCA TCGGGCCAAG 
GCATCGGGAT TCTCCTATCT GAACGACGCG GTCGTGGCCA TCAACCTGCT CCTGGAAAAG 
GGCCTGCGGG TGGCGTACCT CGATATCGAT GCCCACCACG GCGACGGAGT GCAGGAAGCG 
TTTTACGATA CGGACCGGGT CCTGACCATT TCGATTCACG AGAGCGGCAT GTACTTCTTT 
CCCGGCACCG GTTTCGAGGG GGAAACCGGC ACCGGCGCGG GCACGGGGTA TTCGGTCAAT 
ATCCCGCTGG TGGCCCACGC CGACGATGCG CTTTTCATGA AGGCCTTCGA CGAAGTGGCG 
TTTCCGCTTC TCGCCGCCTA TAATCCCGAC GTCCTCGTGA CTCAACTGGG CGCCGACACC 
TTCCGTACCG ATCCTCTCAC GCGGCTTGAG GTGACGACTC ATAGCTACAC CTATATCCTG 
CGCAAGCTCA AGGCGCTCGG CATCCCCTGG GTTGCCGTGG GAGGGGGCGG ATACAACCTG 
GTCAATGTGG CCAGGGCCTG GACCCTTGCC TGGGGGGTGA TGAACGGGGT CGAACTGCCG 
CCCCGACTGC CGGATTCGTT TGTGTCGATC ATCGGCCGGC TCGGCTATCC CAACAGGATG 
CTCCTCGATG CCATGCACTG GGCCCAGGAG GACGACCGCA ACCAGGCACT GGACGCGGTG 
GAGCGAAGCA TAGCTGTCAT CCGGAAGACG ATTTTTCCGG TGATCATCGG TTCCTATGGC 
GAGACTTCCG GGGAATGA

Protein sequence

MPARTALIYS NDFARFSYGD DHPFKIQRFI LAFELMRAYG LMELPNVKIL DCPRAAEEAL 
LTFHAPDYLD RLREFSESDD ARADFRYGLG DLDNPVFRGL YDWARLGAGG TIEAARLVAE 
EGYDIAFNLA GGWHHAHRAK ASGFSYLNDA VVAINLLLEK GLRVAYLDID AHHGDGVQEA 
FYDTDRVLTI SIHESGMYFF PGTGFEGETG TGAGTGYSVN IPLVAHADDA LFMKAFDEVA 
FPLLAAYNPD VLVTQLGADT FRTDPLTRLE VTTHSYTYIL RKLKALGIPW VAVGGGGYNL 
VNVARAWTLA WGVMNGVELP PRLPDSFVSI IGRLGYPNRM LLDAMHWAQE DDRNQALDAV 
ERSIAVIRKT IFPVIIGSYG ETSGE