Gene TM1040_2923 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2923
Symbol
ID	4078601
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	3093742
End bp	3094668
Gene Length	927 bp
Protein Length	308 aa
Translation table	11
GC content	60%
IMG OID	638008252
Product	histone deacetylase superfamily protein
Protein accession	YP_614917
Protein GI	99082763
COG category	[B] Chromatin structure and dynamics [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0123] Deacetylases, including yeast histone deacetylase and acetoin utilization protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.498273
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCACCG CATTGCTCAC TCACGCGGAT TGCCTCACGC ATGAAACACC GCCGGGGCAC 
CCTGAGCAGG TGGCGCGGCT GGAGCATGTG CTACATGCAC TCGCCGGGCT TGATCTTGTA 
CGGGTGACCG CACCGTTGGC AGCCGAAGAC GATATCTTGC GCGCCCATCC CGCCACTTAC 
CTTGCGGACC TGCGCCGCGC GTTGCCGACC GAGGGGCGTC GCGCGCTGGA TGCGGACACA 
TGGATGTCGG CGGGATCTTT GGATGCTGCC TTCAGGGCCG TTGGCGCGGC CGTGCGTGCC 
GTCGATATGG TGCTTGCGGG TGACGTGCAG AATGCGTTTT GCGCAACGCG CCCGCCGGGG 
CATCACGCGG AGACAGACAC GCCCATGGGG TTTTGTCTGT TTGGAACAGC TGCGCTTGCG 
GCCAAGCATG CGCTGGATCA TCACGGGCTC AAACGGGTCG CGGTGGTCGA TTTTGACGTC 
CATCACGGAA ATGGCACACA GGATTTGCTG TGGGACGAGC GCCGCGCCTT GGTAATTAGC 
TCCCATCAGA TGCCGCTCTG GCCCGGGAGC GGGAACTCGG ACGACGATGG TGCTTACGAC 
AATGTGATGA ACCTGCCACT GCGCCCCGAA ACCGGCGGCG ATGAAATGCG GCAAATCTAT 
CAAACGCAGG CCTTTGCACG CCTCAGAGCG TTCAAGCCCG AATTGATCAT CCTTTCGGCA 
GGGTTTGACG CCCACCGTGA AGATCCATTG GCACAGCTCA ATTGGAAAAC CGATGATTTC 
CGGTGGCTCA CGAGTGAACT GTGCCTGCTT GCACAAGAGT TGTGTCAGGG GCGTATCGTC 
TCGACTTTGG AAGGCGGATA TGATCTGAAC GCGCTAGCCG ATGCCGCCAA GGCACATGTG 
GAAGAATTGA TAAAGGCCGC GACATGA

Protein sequence

MATALLTHAD CLTHETPPGH PEQVARLEHV LHALAGLDLV RVTAPLAAED DILRAHPATY 
LADLRRALPT EGRRALDADT WMSAGSLDAA FRAVGAAVRA VDMVLAGDVQ NAFCATRPPG 
HHAETDTPMG FCLFGTAALA AKHALDHHGL KRVAVVDFDV HHGNGTQDLL WDERRALVIS 
SHQMPLWPGS GNSDDDGAYD NVMNLPLRPE TGGDEMRQIY QTQAFARLRA FKPELIILSA 
GFDAHREDPL AQLNWKTDDF RWLTSELCLL AQELCQGRIV STLEGGYDLN ALADAAKAHV 
EELIKAAT