Gene OSTLU_39442 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_39442
Symbol
ID	5004756
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009366
Strand	-
Start bp	260014
End bp	261144
Gene Length	1131 bp
Protein Length	376 aa
Translation table
GC content	55%
IMG OID	640420177
Product	predicted protein
Protein accession	XP_001420801
Protein GI	145352960
COG category	[R] General function prediction only
COG ID	[COG2319] FOG: WD40 repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	0.512984
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAACG CGGTGTTGGG GAAGGTAGAA AAGTTAGAAA AGGAGAATGC AGAGCTTGTG 
GAGCGACTGA TGGAGATGAA GACGAAGGAG GCGGAGAAGA TGAATGAAAT TAACGATTTG 
TACGCTGATT TGTTGCGACA AAAGAAGAGC GTAGAATTGA ATGCGAGGGC GGAGAGTCTC 
GCTGAGGCCT CGGCGGCGAG TATGAAGGCG CTTTCGATGT CTACCGTCAT GAGCAACGTC 
GTGCCTTCGA AGAAGAGACA TATTTTACAA AGTAACAAGG GTGGGACGCA CCGTGTCGCC 
CTCTCGCACG ATGGTTTCAC CGTAGCAAGC GCCGGAGAGG ACAAGGTAAT CGCTATGTTC 
GACACGAATA CGGGCGCACG AACCAGCGAA TTGACTGGTT TGCTCGGTGC AGCATTAGAT 
GTTACATTTA GCGCCGACGA CTCGCTCGTC CTCGGGACCT CGACCGATTG CTCGCTCCAG 
CTTTGGGACG CGCTCACCGG TCGCGTACGG CACCGACTCA CTGGGCACGC GCAAAAGGTG 
ACGTCGGCGC GAATCAGCCA GATTGATGCT AAGCGCGCGA TTTCGTGCTC TCAGGACCGG 
AACGTGAAGC TTTGGGATCT CAATCGTGGA CACGTAACGT CATCCATGTT GACTTCAAGC 
GGCGTGTACT CGGTCGTCTT CGACGCAAAC GAACAGCAAG CGTATTCCGG TCACTTTGAT 
GGCGCGATTC GCGCGTGGGA TCTTCGCGCG GGGAACGTAG CGCGCGAAAC GAAGGTGCAT 
AATGGTTTAA TCACCGCCGT CTTCGATACG CCAAATCAAA ACGAAATTCT GACAAACAGT 
CGCGACAACA CGTTGAAACT CGTCGATATT CGAACAATGG ACGTCGTGCA AACGTTCTCC 
GCGCCAAAAT ATCGCGTCGG CACTGATTGG AGTAATCCTT GCGTGTCACC GGATGGACAA 
CATATCGCAT CTGGCGGGGC AGACGGGGCG TTATTCATCT GGCGTGTACA GGGCGGACGC 
TTGATGACGA CGTTGCACGG TCACGACGCC GTCGTCGCGA CGTGCGCGTG GAACGCGGCG 
GGCGTGCTCG CGTCGGCGTG CAAAAATGGC GTGTGTCTGC TGTGGGAATA G

Protein sequence

MKNAVLGKVE KLEKENAELV ERLMEMKTKE AEKMNEINDL YADLLRQKKS VELNARAESL 
AEASAASMKA LSMSTVMSNV VPSKKRHILQ SNKGGTHRVA LSHDGFTVAS AGEDKVIAMF 
DTNTGARTSE LTGLLGAALD VTFSADDSLV LGTSTDCSLQ LWDALTGRVR HRLTGHAQKV 
TSARISQIDA KRAISCSQDR NVKLWDLNRG HVTSSMLTSS GVYSVVFDAN EQQAYSGHFD 
GAIRAWDLRA GNVARETKVH NGLITAVFDT PNQNEILTNS RDNTLKLVDI RTMDVVQTFS 
APKYRVGTDW SNPCVSPDGQ HIASGGADGA LFIWRVQGGR LMTTLHGHDA VVATCAWNAA 
GVLASACKNG VCLLWE