Gene Hoch_4049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_4049
Symbol
ID	8546450
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	5557259
End bp	5558338
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	73%
IMG OID	646388726
Product	Histone deacetylase
Protein accession	YP_003268441
Protein GI	262197232
COG category	[B] Chromatin structure and dynamics [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0123] Deacetylases, including yeast histone deacetylase and acetoin utilization protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.248474
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.645592
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCATCG GCTACGTTCT CGACGACGTC TTCACCGAGC ACCGACCGCC GGGTTCGCAT 
CCCGAGCGGC CCGAGCGTAT CGGCGCGGTG CGGGATGCGC TGCGCGCGGC GCATCTGCGC 
GAGCGCGCCA CGCTCCTCCC GGTGCGTGAG GCCAGCGAGG ACGAGCTTGG TCGCGTGCAT 
CACGCCGGCT ATCTGTCCGA TCTCACGCGC ACCGTGCCCG GGCAGAGCGG CTGGCTCGAC 
GGCGACACCT ACTTCTCGCC CGGGACCTGG GAGGCCGTGC TCAAGGCCGC CGGGGCCGTG 
GTCGATGTCG CCCTGGGCGT GCTCGACGCT CGCTTCCAGC GCGGCATGGC GCTGGTGCGG 
CCGCCCGGAC ATCACGCCGA GGCCGACCGG GCCATGGGCT TCTGCCTCAT CAACAACATC 
GCCGTGGCGG CGGCGGCCGC GCGCGCGGCC GGGGCGGCGC GGGTGGCCAT CGTCGATTGG 
GACGTCCACC ACGGCAACGG CACGCAGCAC ATCTTCGAGG AGGATCCCTC GGTGCTGTTC 
CTGTCGTGCC ATCAGTACCC GTTCTATCCC GGCACGGGCG CGCCCTCCGA GGTCGGCCGC 
GGGGCCGGGG TCGGGGCCAC GGTCAACGTC GGGCTGCCCG CGGGCGCGGG CGATCGCGCG 
TACATGGCGA CCATGAACGA GGTCTTTGCG CCCGCGCTGC GGCGCTTTCA GCCCGATATC 
ATCCTGCTCT CGGCCGGCTT CGACGCCTAC GTCGATGACC CGCTGGCCGG CATGCGGGTG 
AGCCTCGGCG GCTTTCGCGC GCTGGCCGGG ACGCTGGCGC GGCTGGCCGA TGAGCTGTGC 
GGCGGTCGGC TGGCGTGCGC GCTCGAGGGC GGATATCACC TCAAGGGGCT GGGGGCCGGG 
ACCGTGGCGC TGCTCGATGC CTTCGAGCAT CCCAGCGCTG AGGCCGAGGT GATCGAGGGC 
GATGGCGAGG CGCCCGATCC GATCATTGAT TCGCCCGTGC TCGAGCCGCG CGCGCGGGCC 
GCGATCGATG CGACCCTGGC CGCGCTCGAT GCCGCCGGCG GCGTGCGCGC GCCGTCGTGA

Protein sequence

MAIGYVLDDV FTEHRPPGSH PERPERIGAV RDALRAAHLR ERATLLPVRE ASEDELGRVH 
HAGYLSDLTR TVPGQSGWLD GDTYFSPGTW EAVLKAAGAV VDVALGVLDA RFQRGMALVR 
PPGHHAEADR AMGFCLINNI AVAAAAARAA GAARVAIVDW DVHHGNGTQH IFEEDPSVLF 
LSCHQYPFYP GTGAPSEVGR GAGVGATVNV GLPAGAGDRA YMATMNEVFA PALRRFQPDI 
ILLSAGFDAY VDDPLAGMRV SLGGFRALAG TLARLADELC GGRLACALEG GYHLKGLGAG 
TVALLDAFEH PSAEAEVIEG DGEAPDPIID SPVLEPRARA AIDATLAALD AAGGVRAPS