Gene OSTLU_4812 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_4812
Symbol
ID	4999435
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009355
Strand	-
Start bp	744675
End bp	745715
Gene Length	1041 bp
Protein Length	314 aa
Translation table
GC content	58%
IMG OID	640414856
Product	predicted protein
Protein accession	XP_001415920
Protein GI	145341653
COG category	[C] Energy production and conversion
COG ID	[COG0584] Glycerophosphoryl diester phosphodiesterase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CCGGGACTGT TCGAACCCGC CGGTTGCGCC GTCATCGGGC ACAGAGGTTT ACAAGCGAAT 
CGCGCTTCTG GCGCCGGTAT TCGTGAAAAC ACGCTAGCAT CGTTCAACGC GGCTTCTGCT 
GGTGGCGCGG AGTGGTGTGA GTTTGACGTT CAAGTGACCG CAGACGGTGT TCCCGTCGCT 
TGGCACGACG ACGTCGTCAT CATTCGTCGC GGACTCGGAC CTTTGGAGTC GTTTAGCGTT 
CGAGAGATTG ACTGGGCGGA TCTGCGCGAA CTGTCTCGCG CCGCGCGCGC TACCGCCGCG 
CGAGCGTCCA ACGCCCTCGG TGTTGAAAAG ACAGTTCCTT TAACCACCGA CGACGAAGAC 
GACGAAGACG ACGACGATTA CGACGAAGAC GACAACAAGG TGACATTTTA TCGCGTGTTC 
GGCGGCGATC TTGAACCTCA ACCGTGGGTC ATGGAAGTCG AAGATGAGAT CCCAACTTTG 
GCACAGATTC TTGGAAACAC GCCGAAAGAG CTTGGCTTCA ACATCGAGCT CAAGTTCGAC 
GAAGAGAACA GCTGTGAAAC GCGCCGCTTG GTCGCGGAAC TCCGCGCCAT TCTAGCGGTT 
TGCATGGCGC AACCCAGTCG CAGAATCGTG TTCTCATCTT TCGATCCAGA TGCCGCTCTA 
CTCATGCGTG CCATCCAGGG CTCATATCCA GTGATGATAT TGACCGATGC CGAGCCCCAT 
CACGTCGACC CGCGTCGACG TTCAGTCGCT GCCGCGATGG AAGTCGCGCT CGAAGGTGGC 
TTGTGTGGCG TTGTGTCGAA CGTCAAGGCG ATTATATCGC GCCCGTCCGA CGCGACCGAT 
GTTCGAGACA GTGGTTTACT TCTCGCTACA TACGGCGAAG GTAACGATGA TGTCGCTGCA 
TCGTCGACGC AAGTCGAGCT CGGCGTTTTC GGGATCATCA CAGACGCCGT GCCAGCCGTC 
GCGAAGAAGT TCAATGCGAC GACTGTGAAT CCTGGCAACT TGGCTCCGGC GCTTGCGCCA 
TTGGTATCAC CCTCAGTTGA C

Protein sequence

PGLFEPAGCA VIGHRGLQAN RASGAGIREN TLASFNAASA GGAEWCEFDV QVTADGVPVA 
WHDDVVIIPS NALGVEKTVP LTTDDEDDED DDDYDEDDNK VTFYRVFGGD LEPQPWVMEV 
EDEIPTLAQI LGNTPKELGF NIELKFDEEN SCETRRLVAE LRAILAVCMA QPSRRIVFSS 
FDPDAALLMR AIQGSYPVMI LTDAEPHHVD PRRRSVAAAM EVALEGGLCG VVSNVKAIIS 
RPSDATDVRD SGLLLATYGE GNDDVAASST QVELGVFGII TDAVPAVAKK FNATTVNPGN 
LAPALAPLVS PSVD