Gene Huta_2249 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Huta_2249
Symbol
ID	8384544
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhabdus utahensis DSM 12940
Kingdom	Archaea
Replicon accession	NC_013158
Strand	+
Start bp	2297429
End bp	2298439
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	65%
IMG OID	644973319
Product	histone deacetylase superfamily
Protein accession	YP_003131149
Protein GI	257053316
COG category	[B] Chromatin structure and dynamics [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0123] Deacetylases, including yeast histone deacetylase and acetoin utilization protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.775284
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGTTTG GTTACCGCGA AATCTGCCTC GAACACGACA CCGGCAGTCG GCATCCGGAG 
AGTCCCGACC GACTGCGTGC GATACAGCGG ACCCTCGCCG ATTCGGCGAA CGTCGAGTAC 
GTTCCCGCCA CTGCCATTCC TCGTGACGCT ATCTGGGCCG TCCACGATCA CGACTATCTG 
GAAGATGTCA GGCAGTTCTG TGCCAACGGG GGCGGGAACT GGGACGCCGA CACTGTCGCC 
GTCGAGGCGA CCTGGGATGC GGCGGTGGCG AGTGCCACGC TTGCCGCGTG GGCCGCAGAC 
GAAGCACTCG AGGGTGCCGA CGGTTGCGAG ACGCCGTTCT CGCTGGGTCG ACCGCCGGGT 
CATCACGCCG TCGAAGACGA CGCGATGGGT TTTTGCTTTC TCAACAACGC CGCAATCGCG 
GCCGAACATG CACTTCGACG GGACGGCGTC GACCGGGTGG CGATACTCGA CTGGGATGTC 
CACCACGGCA ACGGCACGCA GGACATCTTT TACGACCGCA GTGACGTGTA CTACGCCTCG 
TTCCACGAGG AGGGTCTGTA CCCCGGGACG GGCGACGTCG GGGAGACCGG TGCCGACGCG 
GGGCGCGGAC GCACCCTGAA CGTGCCGTTC CCGTCGGGGA GTGGTGACGC AGATTACCTC 
GCCGTCCACC GGGAGGTCGT CGCCCCCGAG TTCGAGAACT TCGAGCCGGA TCTCATCATC 
GTCAGTGCAG GGTTCGACGC TCACGAGAAC GATCCGATCT CCCGGATGCT GGTCTCGACG 
GCCGGGTACG GCGTGCTCGC GGAACGCGTC CACGAACTTG CCGACCGGAT CGACGCTGGG 
CTGGCGTTCG TTCTGGAAGG CGGCTATGGC CTCGAAACAC TCTCGGCCGG CGTTCGCGAG 
ATCCACGAGG TACTCAACGG CGAGCACGCC GACTCGATCG AACCGGCACC CACCGATGGC 
GGCCAGAACG TGCTCGATTC GCTGGTGTAT CAGGGCTTCG GGTCGAGATA G

Protein sequence

MKFGYREICL EHDTGSRHPE SPDRLRAIQR TLADSANVEY VPATAIPRDA IWAVHDHDYL 
EDVRQFCANG GGNWDADTVA VEATWDAAVA SATLAAWAAD EALEGADGCE TPFSLGRPPG 
HHAVEDDAMG FCFLNNAAIA AEHALRRDGV DRVAILDWDV HHGNGTQDIF YDRSDVYYAS 
FHEEGLYPGT GDVGETGADA GRGRTLNVPF PSGSGDADYL AVHREVVAPE FENFEPDLII 
VSAGFDAHEN DPISRMLVST AGYGVLAERV HELADRIDAG LAFVLEGGYG LETLSAGVRE 
IHEVLNGEHA DSIEPAPTDG GQNVLDSLVY QGFGSR