Gene OSTLU_119545 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_119545
Symbol	Hda2
ID	5000186
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009356
Strand	-
Start bp	521520
End bp	523110
Gene Length	1591 bp
Protein Length	487 aa
Translation table
GC content	47%
IMG OID	640415607
Product	histone deacetylase
Protein accession	XP_001416418
Protein GI	145343628
COG category	[B] Chromatin structure and dynamics [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0123] Deacetylases, including yeast histone deacetylase and acetoin utilization protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAAGA AAATTGCATA CTTTTATGAC CAAGAAGTGG GAAACTTCTA CTACGGACAG 
GTGAGAAACG AAGAGGGATC ACGCAACAGC TTCTGATTGT TACGTTCGTA GGGACATCCA 
ATGAAACCGC ACCGTATGAG AATGACACAT AATCTGCTCT TACACTACGA TTTGTACAAA 
GACATGGAGG TACGTTGTTG CGATGATAGC GGTGGACTAG CCGTTGAAAA TCACGTGTTC 
CATGATCTTG ACTCTCCACG TGTAGGTGTT TCAACCCACG CCCGCGCAAG CCGATGACAT 
GACGCAATTT CATAGCGACG AATACATTGA ATTTCTACGC CTTGTCACCC CTGATAATCA 
GCATGAACAC ATGCGCCAGT TGAAGAGGTT CAATGTTGCT GAGGACTGCC CGGTATTTGA 
CGGACTGTTC CGCTTCTGCC AACTGTACAC AGGCGGCTCT GTTGGAGGGG CTGTCCGCTT 
GAATCATGGA CTATCAGAAA CTGTCATAAA TTGGTCTGGC GGGCTTCATC ACGCAAAAAA 
GAGTGAAGCA AGTGGGTTTT GCTATGTTAA CGATATTGTA CTTGCGATAT TGGAGTTACT 
CAAGCAACAT CAGCGGGTTT TGTACATTGA TATAGATATT CATCACGGTG ACGGGGTTGA 
AGAAGCGTTT TACACGACAG ACAGAGTAAT GACGGTTTCG TTTCACAAAT TCGGCGAATA 
TTTCCCAGGG ACTGGGCACT TGCAGGACAT CGGCCAACAT GCTGGCAAGT ACTATAGTGT 
CAACGTACCC CTAAAGGATG GAATAGATGA TGAAAGCTAC GAGCTTCTCT ACAAGCCGTT 
GATGTCAAAA GTCATGGAGA TCTATCAGCC CGATGCAGTT GTATTTCAAT CTGGGGCAGA 
CTCTCTTTCT GGAGACCGTT TGGGTTGTTT CAATCTGTCC ATCAAAGGTC ACGCAGAGTG 
CCTCAAATAC ATGACTACGT TCAACGTACC TTTACTTGTA CTTGGGGGCG GTGGTTACAC 
GATACGGAAC GTAGCCAGAT GCTGGGCATA CGAAACGGGT TGCTTACTTG ATCGAGAACT 
GGTAGATGCT ATGCCACAAA ACGACTACTC AGAATATTTT GGCCCAACTC ACACACTGCA 
TATCCAACCG AGCAACATGG AGAATCAAAA TACTCGCGAA TATCTTGAAG GGGTTCGAGC 
ACATCTTTTG GAAAACCTGT CGAAGATGAC CTGCAAACCC AGTGTGCCTT TCCACGAAGT 
ACCACGTGAT TCGACTAATA CTCGTAATGT CAGTGTTGAC GTCGAGCATA TTAGCGAAAA 
GAGCGAAAAG GGCTTCTCAG CCAGCCTTGA TAAATCTCAA TACGAGAATG AGCGTCACGT 
CGCGGCTCTG CGTCGTCAAC AAAGTATGGT TGTACGAGAT GATATCCCGA GCTCGACGAT 
CTCTATTATG GAGAACACAC CGAGCTCTGA GAAGAGTCAT GATTTACCGA TATCGGCCAC 
AGGTCTGCCG CAAACACATA CTCCACGGAG CGACGAAGCA ACGGCGATGA CGATGTTCCC 
AAGCGTTTCG AATAAAAAAG AAGGAATTTA G

Protein sequence

MKKKIAYFYD QEVGNFYYGQ GHPMKPHRMR MTHNLLLHYD LYKDMEVFQP TPAQADDMTQ 
FHSDEYIEFL RLVTPDNQHE HMRQLKRFNV AEDCPVFDGL FRFCQLYTGG SVGGAVRLNH 
GLSETVINWS GGLHHAKKSE ASGFCYVNDI VLAILELLKQ HQRVLYIDID IHHGDGVEEA 
FYTTDRVMTV SFHKFGEYFP GTGHLQDIGQ HAGKYYSVNV PLKDGIDDES YELLYKPLMS 
KVMEIYQPDA VVFQSGADSL SGDRLGCFNL SIKGHAECLK YMTTFNVPLL VLGGGGYTIR 
NVARCWAYET GCLLDRELVD AMPQNDYSEY FGPTHTLHIQ PSNMENQNTR EYLEGVRAHL 
LENLSKMTCK PSVPFHEVPR DSTNTRNVSV DVEHISEKSE KGFSASLDKS QYENERHVAA 
LRRQQSMVVR DDIPSSTISI MENTPSSEKS HDLPISATGL PQTHTPRSDE ATAMTMFPSV 
SNKKEGI