Gene Dole_1974 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1974
Symbol
ID	5694814
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	2387523
End bp	2388560
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	63%
IMG OID	641264572
Product	histone deacetylase superfamily protein
Protein accession	YP_001529855
Protein GI	158521985
COG category	[B] Chromatin structure and dynamics [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0123] Deacetylases, including yeast histone deacetylase and acetoin utilization protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTCGCA AGGTAGCCAT ATCCCGGGAT GACCGCTTTC TGCTTCACAA AACCGGTCAC 
GCCCATCCGG AGAGCCCCTC CCGGCTGGCT TCGATCTATC GCATGGTGGA CCGGCATTTT 
GCCGGCACAG TGACAACAAT GACGCCGGAG CCGGCCACCC TGGACCAGCT GGAGCTGGTC 
CACACCCCCG GCCATGTGAA AAAAATATTA AAGACCGCTG AGCACAAAAT CACCAGCATG 
GCGCCGGACA CGCCGGTCAG CGGCCACTCC TACCTGGCGG CCTGGCTGGC GGCCGGGGCC 
TGCATGCAGG GGGTGGACCT TCTTTTGTCC GGCGCCTGCC GCGCCTTTTT CTCCCTGGTG 
CGGCCCCCGG GCCACCACGC CCTGCCGGAC CGGGCCACCG GTTTCTGCCT GCTCAACAAC 
CTGGCCATCG CGGCCCGGTA TGCCCGAATG CGTTACAACC TGGAACGGAT TCTGATCGTC 
GACTGGGACG TGCATCACGG CAACGGCATT CACGACATCT TTTACCGGGA GCCAGGCGTT 
TTCTACGTCT CTTCTCATGA CCTGATGCTG TTTCCCTATT CCGGGGAGGC AGGCGATACC 
GGCGAGGCCG GGGGCAGGGG GTTTACCCTG AACATGCCCC TGTCCCGCTC CTTTGGCGAC 
GGTGACATGG CATACATCTA CCGCACTGTG CTGACGCCGG TTTTCCGGTG GTACACGCCC 
TCAATGGTAA TGATCGCCGC CGGGTTCGAC GCCCATGCCG ACGATCCCCT GGGCCGTTCG 
GCCTGGAGCG AAAACGCCTA TTTCCTGCTT GCGCGCCTGG TGTGCGAACT GGCCGATGCC 
GATCATGTTC CCCTTCTGCT TTCCCTGGAA GGCGGATATG ACCCCGGCGC CAATGCCGCG 
TCAGCCAAAG CCGTGCTGGA GGCCCTGGTC TCATACGCTC CGGCCGGACC GGTGCCGGCG 
CCCCTGGACC CGAATGCGGC CGACGAACTG CTGGAGACTG TTTTTACAAC CCACAAACCT 
TATGGAATCG TGTCATGA

Protein sequence

MSRKVAISRD DRFLLHKTGH AHPESPSRLA SIYRMVDRHF AGTVTTMTPE PATLDQLELV 
HTPGHVKKIL KTAEHKITSM APDTPVSGHS YLAAWLAAGA CMQGVDLLLS GACRAFFSLV 
RPPGHHALPD RATGFCLLNN LAIAARYARM RYNLERILIV DWDVHHGNGI HDIFYREPGV 
FYVSSHDLML FPYSGEAGDT GEAGGRGFTL NMPLSRSFGD GDMAYIYRTV LTPVFRWYTP 
SMVMIAAGFD AHADDPLGRS AWSENAYFLL ARLVCELADA DHVPLLLSLE GGYDPGANAA 
SAKAVLEALV SYAPAGPVPA PLDPNAADEL LETVFTTHKP YGIVS