Gene Hlac_0109 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0109
Symbol
ID	7401629
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	114841
End bp	115845
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	67%
IMG OID	643707172
Product	histone deacetylase superfamily
Protein accession	YP_002564785
Protein GI	222478548
COG category	[B] Chromatin structure and dynamics [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0123] Deacetylases, including yeast histone deacetylase and acetoin utilization protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.39401
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCTTCG GCTACAGCGA TCGGTGTCTC GAACACGACA CCGGCGAACG GCATCCGGAA 
AACCCAGATC GACTGCGCGC GATCCGTCGC GGCCTGGCGA AGCGACACGG CGTCGAGTAC 
GCAGAGGCGG ACCCCGCGAC GCGCGAGGAG GTTGTCGCGG TCCACGACGC GGAGTACGTC 
GACGAACTGG AGGCGTTCGT CGCCGACGGC GGCGGGAGCT GGGACCCCGA CACCGTCGCG 
AGCGAGGGGA CGTGGGACGC TGCCCTCGCC TCGGCCGGCC TCGCACAGTG GGCGGCTCGA 
TCCGCGCTCA ACGGCGCCGA CGGTCGAGAC ACCCCGTTTG CGCTCGGACG GCCGCCGGGC 
CACCACGCGG TGCCCGATGA CGCCATGGGT TTTTGCTTTT TCAACAACGC CGCCGTCGCG 
GCCCAGACCG TTCTCGACGA CGGGGCCGCA GACCGGGTCG CAGTCTTCGA CTGGGACGTA 
CATCACGGAA ACGGGACCCA AGACGTATTC TACGACCGCG GTGACGTGCT CTACGCATCG 
ATTCACGAGG ACGGACTCTA TCCGGATACC GGAGCGCTCG ACGAGACCGG CCACGACGAA 
GGGGCGGGAA CAACGGTGAA CCTCCCGCTT TCGGCCGGGG CGGGCGACGC CGACTACCTC 
TACGCCATCG ACGAGGTGGT CGCCCCGGCG ATCAAACGGT TCGACCCCGA TCTCGTGATC 
GTCTCGGCCG GGTTCGATGC TCACCGACAC GACCCCATCT CGCGGATGCG CGTCTCCTCG 
GAGGGGTACG CGCTGATGAC CGACCGAATC CGGACGGTCA CCGACAACAT CGAAGCTGCG 
AACTCCTACG TCCTTGAAGG AGGCTACGGT CTCGACACGC TGGCCGAAGG CGTCTCGATG 
GTCCACGAGA CGTTCGACGG GCGCACGCCT GTCGGCGATG ACGACGACCC CGACGAGAAG 
ACGGAGTCGT TGGTGACCGA GTTGCGGGAG CTGCTCGACT TATAA

Protein sequence

MRFGYSDRCL EHDTGERHPE NPDRLRAIRR GLAKRHGVEY AEADPATREE VVAVHDAEYV 
DELEAFVADG GGSWDPDTVA SEGTWDAALA SAGLAQWAAR SALNGADGRD TPFALGRPPG 
HHAVPDDAMG FCFFNNAAVA AQTVLDDGAA DRVAVFDWDV HHGNGTQDVF YDRGDVLYAS 
IHEDGLYPDT GALDETGHDE GAGTTVNLPL SAGAGDADYL YAIDEVVAPA IKRFDPDLVI 
VSAGFDAHRH DPISRMRVSS EGYALMTDRI RTVTDNIEAA NSYVLEGGYG LDTLAEGVSM 
VHETFDGRTP VGDDDDPDEK TESLVTELRE LLDL