Gene Dret_0223 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0223
Symbol
ID	8418027
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	279225
End bp	280565
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	61%
IMG OID	645036788
Product	Histone deacetylase
Protein accession	YP_003197103
Protein GI	258404361
COG category	[B] Chromatin structure and dynamics [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0123] Deacetylases, including yeast histone deacetylase and acetoin utilization protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.195671
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGAAAG TCGCCAACAG TCTCGGCGTT GTTTTTTTCC CGGCTTTTGA CTGGGCTATC 
TCCCCAACGC ACCCCGAGCG GCAGGAGCGG CTCCTGTACA CCATGGATCA ACTGCAGGAG 
GAGGGGGTCT TCGATATCCC GGGGATCGCC GAATATAAGC CGGATATTGC CAGTCTGGAG 
GACGTGGAGC GGGTCCACTT CGCGTTTCCG CGCACCGAGG ACGTCCTCAC CGACTCCCAT 
CTTATTTCGG CCGGGGGCGC CATCCGCGCC GGTCAGATGG TCCTGGACAA GGAGCGTGAC 
AAGTCGTTCG CCCTGGTGCG CCCGCCGGGG CACCACGCCA TGAAGTCCGT GCACGGCGGC 
CGCGGCTTTT GCAATGTGAA TATGGAAGCG ATCATGATCG AGCGGTTGCG CCGGCAGTAC 
GGGGTGAACC GGGTGGCGGT GGTGGATACC GATTGCCATC ACGGCGATGG CACCCAGGAC 
ATCTATTGGC ACGATCCGGA GACGCTGTTC ATCTCCCTGC ACCAGGACGG ACGGACCATT 
TTTCCGGGCT CCGGCTTCCC CGGCGAGATC GGCGGGCCCA AAGCGGCCGG GCGGAACCTC 
AATGTGCCGC TGCCGCCCGG GACAAGCGAT GCGGGATTTT TGTTGCTGAT GGACGAATTG 
GTCTTGCCAG TGCTGCGGGA CTTTCAGCCG GAGCTGATTG TCCATTCCGC CGGGCAGGAC 
AACCATTTTT CCGATCCCAT TACCTCCATG AATCTTTCGG CCCAGGGCTA CGCCCGCCTG 
AGCCAGAAAT TGCAGGCCGA TATCGCCGTG CTCGAGGGGG GCTACGCCAT CGAAGGCGCC 
CTGCCGTACG TCAATACCGG GATCATTCTC TCCATGGCCG GTCTGGACTT TTCCCATGTC 
CGCGAACCAG CCCTGCGGCC CGAGAGCGTA GCGCAGGACG CGAAGATCAC CGAGTATCTC 
AAGCAATTGG CCCCGGCGGT GCGGGATCTC TATTTCCATC CTCCGGAGAA GCTGATCGAC 
CGGGAGAAGG AGGGGGATTT CTTCGTGCGC GACAAGGAAA TTTTTTACGA TACCGACGGG 
CTCATGGAGC AGCAGCGGGA GTTTGTCCTG GATTGTCCGC ATTGCCCCGG GCTGTATAAG 
GTCCAGACCT CCTCGACCAA GACCCCCTTT TGTCTGGGGA TCGAACTGGG GAGGCAGTGC 
TGCGACAGTT GCGCCAGACG CGCGGAGGAG GAATTCGCCC GGGCCCAGAA AAGCCTTCGG 
TATGCGGTTA TTCAATATAT TGACCGCATT CAGGATTTCT CGCAACGGGT CGTGGGCGAC 
GCTATGGACA AGGAGATGTA G

Protein sequence

MLKVANSLGV VFFPAFDWAI SPTHPERQER LLYTMDQLQE EGVFDIPGIA EYKPDIASLE 
DVERVHFAFP RTEDVLTDSH LISAGGAIRA GQMVLDKERD KSFALVRPPG HHAMKSVHGG 
RGFCNVNMEA IMIERLRRQY GVNRVAVVDT DCHHGDGTQD IYWHDPETLF ISLHQDGRTI 
FPGSGFPGEI GGPKAAGRNL NVPLPPGTSD AGFLLLMDEL VLPVLRDFQP ELIVHSAGQD 
NHFSDPITSM NLSAQGYARL SQKLQADIAV LEGGYAIEGA LPYVNTGIIL SMAGLDFSHV 
REPALRPESV AQDAKITEYL KQLAPAVRDL YFHPPEKLID REKEGDFFVR DKEIFYDTDG 
LMEQQREFVL DCPHCPGLYK VQTSSTKTPF CLGIELGRQC CDSCARRAEE EFARAQKSLR 
YAVIQYIDRI QDFSQRVVGD AMDKEM