Gene OSTLU_16584 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_16584
Symbol	SDG3504
ID	5003491
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009362
Strand	+
Start bp	645079
End bp	646566
Gene Length	1488 bp
Protein Length	495 aa
Translation table
GC content	59%
IMG OID	640418912
Product	predicted protein
Protein accession	XP_001419228
Protein GI	145349623
COG category	[R] General function prediction only
COG ID	[COG5141] PHD zinc finger-containing protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATAAAG TCGTGGGATA CGTGCGACCG ACGGTGCGAA ATAGGTATCG GATGAGCGAG 
GCTGAGGTGG TCGAACGGCG CCGGCGTGAG GCCATCGAAA ACGCCGGCGC CGACGAGACG 
CCGAGCATCT TCAGGACGCC CAGCGTCGAA AAGTGCGATG TGTGTGATTC TGTTCGAGAG 
TTTGACCAAG ATGTGCTCGT GCAGTGCGAT GAGTGCATGA TTTTGGTTCA CATGGGTTGC 
TACGGCGTCA CGACTGCGCC GACGGGCGGG CGTTGGCTGT GTCGAGCGTG CGAACTCGGC 
TTGCGCACGC CGCCGCGGTG CGCGCTGTGT CCGAACGTGG GTGGTGCGAT GAAACCAACG 
TTGTGTGGGA GGTGGTGCCA CGTCGTATGC GCGTTGTGGG CGGAATGCAC GTTCGCGCAT 
CCTGATGGCG TCGCGGAGCC CATCGAAGGC GTCAACATGG TTCCAGCGGA GAGTTTGAAA 
GCAACGTGCG CGGTGTGCGA GCAAAGTTAC GGCGCGTGCG CGCAGTGCAT GGGTACGAAA 
AAGTGTCAAA AAGCGTTTCA CGTGTACTGC GCGAGAGACG CGGAGTGTGG ATACATCGCG 
CACTCGCGCA CGGTGGCGCA GCTGAAACAG GCGGGCATTC GCAAATTCAT CGTGGGTTAC 
GAACAGCCTC TGCGAAACAC CGACACACTT TTGTTTCCGA GTTGTCCCGC GTGCGCAAAC 
TGGCGAGGTC GCAAGCGCAA ACGGCGCGCG TCGACACCGA AGAAGCGAAC TCAGACACCG 
AAGACAAGGC CAACTGTGGA TTCGCGCGAA GTCGAAGACA AAGACGAAGA CGCGAAACCA 
CTCCAGTGCG CCAAGTTTGA CCCTTTAGGC GCGTACGCTC GCGCGTTGAC GGTGTCGCCA 
AAGGATTCGA TACCATATCT CGTCACGGGC GCGCGAACGA GTCGCTTGGA ATCGTTCAGT 
CTTCGAGCCG TCGCACTTGC CGATCCGCCG CGAAATCTGA ACGAGCGTTT CGAGCGCATG 
AAGGCGACGA TTTCAGATCG CTTGACGCTG GGGAAATCGT ATATTCACGG CTATGGTTTA 
TTCGCAAAAC GCGCGCACGC GCGAGGCGAG ATGATCATCG ATTACGTCGG CGAAATCGTG 
CGTCCAGTCG TTGCCGATAT TCGCGAGCGC GACGTGTACG ACACCTGTTT CGGCAACGGG 
ACGTACATCT TCGCGCTAGG CGGCGACGAT CAACCCGTGC GCTTAGACGC CACGTGTGCA 
GGAAATCTCG CAAACTTGGC CAACCATTCG TGCGCACCGA ACGCGCATTC GAGACAAGTG 
TACGCCGCGA ACGACAACCA CATTTGCTTA TTCGCGTCGC GAAACATCCA GCCCGGCGAG 
GAAATTTTGT ACGAGTATAG ACTCGGCGCC GATCAGACGT TACGATGCAA CTGCGGCGCC 
GCAAACTGTC GCGGCGTCGT CAACTTTACC GCCGAGCACC CGGCGTAG

Protein sequence

MDKVVGYVRP TVRNRYRMSE AEVVERRRRE AIENAGADET PSIFRTPSVE KCDVCDSVRE 
FDQDVLVQCD ECMILVHMGC YGVTTAPTGG RWLCRACELG LRTPPRCALC PNVGGAMKPT 
LCGRWCHVVC ALWAECTFAH PDGVAEPIEG VNMVPAESLK ATCAVCEQSY GACAQCMGTK 
KCQKAFHVYC ARDAECGYIA HSRTVAQLKQ AGIRKFIVGY EQPLRNTDTL LFPSCPACAN 
WRGRKRKRRA STPKKRTQTP KTRPTVDSRE VEDKDEDAKP LQCAKFDPLG AYARALTVSP 
KDSIPYLVTG ARTSRLESFS LRAVALADPP RNLNERFERM KATISDRLTL GKSYIHGYGL 
FAKRAHARGE MIIDYVGEIV RPVVADIRER DVYDTCFGNG TYIFALGGDD QPVRLDATCA 
GNLANLANHS CAPNAHSRQV YAANDNHICL FASRNIQPGE EILYEYRLGA DQTLRCNCGA 
ANCRGVVNFT AEHPA