Gene TM1040_2066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2066
Symbol
ID	4077993
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2169776
End bp	2170804
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	63%
IMG OID	638007385
Product	histone deacetylase superfamily protein
Protein accession	YP_614060
Protein GI	99081906
COG category	[B] Chromatin structure and dynamics [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0123] Deacetylases, including yeast histone deacetylase and acetoin utilization protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.229511
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCGA TCTATGATCC CCGCCAACGC GCCCATAACC CCAGCCAGTT CATGGCCTTT 
GGGGTGATGA AGCCCAATCC CGAACAACCC GAACGCACCG AGATCCTGCG CAGCGGCGCG 
GAGGCGGCAG GCTGTACCTT CACAGCGCCC GAGGATGCGG GCCTTGGCCC CATCGCGGCG 
CTGCATTCGC CGGAATACCT GACCTTCCTG CAGACCATCC ACGCCCGCTG GAGCGAGATC 
GAAGGCGCAG GCCCCGAGGT GATTTCTCAT ATCAAGCCGG GAGATCGCCG TGACAGTTAT 
CCGCGGTCTG CGCTAGGGCA GGCGGGCTAT CATCAGGCCG ATACCTCCTG TCCGATCAAT 
GCCGACACTT GGGGCTCTGC CTATTGGTCG GCGCAGACTG CGATCACCGC CGCCGACCTG 
ATTGCAAAGG GCGAGCGCGC CGCCTATGCG CTCTGCCGCC CGCCGGGGCA TCACGCGTTT 
GGAGATATGG CGGGGGGGTT TTGTTTCCTC AATAACTCCG GCATCGCGGC GCAGCTGTTG 
CGGGATCGGG GCCTCAGGCC CGCAATTCTG GACGTGGATG TCCACCACGG CAACGGCACG 
CAGGGGCTGT TTTATGATCG CGACGACGTG CTGACGCTCT CGATCCACGC CGACCCTGCG 
GACTTCTACC CGTTCTTCTG GGGCCACAGT TCTGAGCGCG GCGAGGGCCG GGGGCGGGGC 
TATAACCTCA ACCTGCCGCT GCCGCGTGGT ACCGAAGATG CACCGTTCCT GGATGCACTG 
GACACCTGTC TTGACCGGGT GCGCGCCTTT GGGTGCGATG TGCTTGTGAT CGCGCTGGGC 
CTTGATGCCT CCGTGGACGA TCCGTTTCAG GGCTTTCAGG TTACCGGCGA CGGGTTTTCG 
CGCATTGGCG AGGCAATTGC CCGCGCCGGC CTTCCAACGC TTTTTGTGCA GGAAGGCGGT 
TACATCTCCG ACAGCCTCGG TCATAACCTC ACCCGCGTGC TTGGCGGATT TACCTCTGCT 
GCACGCTGA

Protein sequence

MKAIYDPRQR AHNPSQFMAF GVMKPNPEQP ERTEILRSGA EAAGCTFTAP EDAGLGPIAA 
LHSPEYLTFL QTIHARWSEI EGAGPEVISH IKPGDRRDSY PRSALGQAGY HQADTSCPIN 
ADTWGSAYWS AQTAITAADL IAKGERAAYA LCRPPGHHAF GDMAGGFCFL NNSGIAAQLL 
RDRGLRPAIL DVDVHHGNGT QGLFYDRDDV LTLSIHADPA DFYPFFWGHS SERGEGRGRG 
YNLNLPLPRG TEDAPFLDAL DTCLDRVRAF GCDVLVIALG LDASVDDPFQ GFQVTGDGFS 
RIGEAIARAG LPTLFVQEGG YISDSLGHNL TRVLGGFTSA AR