Gene OSTLU_51202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_51202
Symbol	HXA3501
ID	5004953
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009367
Strand	+
Start bp	248139
End bp	249954
Gene Length	1816 bp
Protein Length	515 aa
Translation table
GC content	55%
IMG OID	640420374
Product	predicted protein
Protein accession	XP_001420946
Protein GI	145353279
COG category	[B] Chromatin structure and dynamics
COG ID	[COG5114] Histone acetyltransferase complex SAGA/ADA, subunit ADA2
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	59
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0345215
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CGACGACGAC GACGACGACG ACGACGACGA CGACGACGAC GGGCGCGAGT CGCGCGTGAA 
CGCACGCGAG TGAGCGCGCG CACGACCGTC GAGGACGCGC GCGACGGGAA CGCGGACGCG 
GAGGTAACGC GACGCATCGG CATCGGCGTT CGGCATCGCA TTCGGCGCCA TGGCGAGCGC 
GCTCGTGCCG AAACGGCGAC GGGTGGCGAC GGAAAACGCG ATGACGAAGC TGAGTGGGAA 
CGGGGAGTCG TGCGCACTGT TTAACTGTAA CTATTGCCAA AAGGACATCT CGAACGTGGT 
GCGCGTACGG TGCGCGGAGT GCGCAAACGT GGATCTGTGC ACGGAGTGCT TCGCGGTCGG 
CGTGGAGCCG CACCCGCACA AGGCGTATCA TCAGTATCAC GTCATCGACA ACATGTCGTT 
TCCGCTGTTC ACGCGAGATT GGGGGGCTGA CGAAGAGTTG TTATTGCTGG AGGCAGTGGA 
GATGTTCGGG TTGGGGAACT GGACCGAGGT GAGCGAACAC GTCGGGACGA AGACGCGCGC 
GCAGTGTCAC GCGCACTATT TTGAAGTCTA CGTCAAGTCT CCTTGCGCGC CGTTACCGGA 
TATGTCGAAG ATTTTAGGAA AAGGCGTCGC GCGTATGACA TCAGACGAGC TCAAAGCGGA 
GGCGGAGCAA AAGGCGAACG AAAATAAGGA TGTGGAGGAG GAGGAGAAGC TTCTCGAATC 
GCTTGCTAAC CCGAACGCAG TGAAGACGGA GGGCAACGTG CAGGAACTCA CAGGTTACAA 
CATCAAGCGC AATGAGTTCG ATCCCGAATA CGACATGGAT GCCGAACTTC CCCTGGCGGA 
GATGGAATTT CGCGAAAACG ACACCGAAGA AGACGTCCAG ATGAAGCTGC GAATGATTGA 
AATCTACAAC AGCCGGCTTC AAGAACGAGC GAGAAGAAAA CAATTCATTC TCGAACGCAA 
TCTGCTGAAC GTGAAAAAGC AACAAAACGT GGAAAAGAAG CGTTCACAAT ACGAGCGCGA 
CTTACACGGC ACCATGCGTA TATTTGCACG CTTTCTCACG AGTACCGAGT ACGACGTCTT 
GCTCGAGGGT CTCGCCGCGG AGCACCGAAT CCGAACCCGC ATCACCGAAC TGAAAGAGTA 
CAGACGCAAT GGTATTCATA CCATCGCAGA GGGCGAGGAT TACGATTTGG AGAAGCGTCG 
TCGTGAGACG GAGTTCGCTC GTCTACACGC GATCGAGCAT CCAACTAGCA AGAACATAGC 
CAGAGCGAAC AAGTTCATCG TGCGAGATGC CACACAAATC AATGAGCAGT TGACTCGCAT 
GAACGACGAA GACAAGACGG TATCCGTGAT CCCGACGCCT CGTACGTCGA GCTTAGGTCC 
TCGCCGTCGA ATGTACTTGT CACTTGATCT CGCCGATCTT CCAGGCGTAG ACCTTTTGAA 
CGACGACGAA AAGGAGTTGT GCAGGAGCTG TCGCTTATTG CCTGTGCAGT ATCTCTCGAT 
GAAGGTGGAG TTGATGCGAG AGGGTCTCAA GTCCGAAAAG CCGCTCAACA GAAATCACGT 
TCGGAATATG TTCAAAGTAG ACCCACTCAA GGCTATTCGT GTGTATGAGT TACTCCTACA 
GCACGGCTGG GTGTTGGAAG ACGGCTTCGT GAACCCAGGT GAGGATGAAG ACTCCGAACC 
TGCGCCGAAA AAGTCAGCCA GCGCAGACGA GGAGGAAGAC GAGGAGGACG ATGAAGTAGA 
TTACGAAACC GACGATAACG ACGAAGACGA GGACGAGGAA GACGACGAGG AAGAGGATAG 
CGAGGAAGAC GATTAG

Protein sequence

MASALVPKRR RVATENAMTK LSGNGESCAL FNCNYCQKDI SNVVRVRCAE CANVDLCTEC 
FAVGVEPHPH KAYHQYHVID NMSFPLFTRD WGADEELLLL EAVEMFGLGN WTEVSEHVGT 
KTRAQCHAHY FEVYVKSPCA PLPDMSKILG KGVARMTSDE LKAEAEQKAN ENKDVEEEEK 
LLESLANPNA VKTEGNVQEL TGYNIKRNEF DPEYDMDAEL PLAEMEFREN DTEEDVQMKL 
RMIEIYNSRL QERARRKQFI LERNLLNVKK QQNVEKKRSQ YERDLHGTMR IFARFLTSTE 
YDVLLEGLAA EHRIRTRITE LKEYRRNGIH TIAEGEDYDL EKRRRETEFA RLHAIEHPTS 
KNIARANNLG PRRRMYLSLD LADLPGVDLL NDDEKELCRS CRLLPVQYLS MKVELMREGL 
KSEKPLNRNH VRNMFKVDPL KAIRVYELLL QHGWVLEDGF VNPGEDEDSE PAPKKSASAD 
EEEDEEDDEV DYETDDNDED EDEEDDEEED SEEDD