Gene OSTLU_40076 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_40076
Symbol
ID	4999383
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009355
Strand	-
Start bp	1106926
End bp	1107939
Gene Length	1014 bp
Protein Length	337 aa
Translation table
GC content	59%
IMG OID	640414804
Product	predicted protein
Protein accession	XP_001416028
Protein GI	145341875
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0447] Dihydroxynaphthoic acid synthase
TIGRFAM ID	[TIGR01929] naphthoate synthase (dihydroxynaphthoic acid synthetase)

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACGACG CGAGACGTCG CGTGGCGCAA ATTGCGAATC ACGTCACGGC TGCCGACGAC 
GGCTTCTCGC GACAAACCTA CGCCCGCGCC GACGCCGCGC GCGTGAGCTC GTACGAGCGC 
GTGCACGGTG ACGTCAGTCG TGATCCCGTT TCGTGGGTGA AGTGCGCGCC GGGCGCGGAT 
GAACGCTCGG TGGCGTCGCA TTACGAATTG CGCGACGTGA TTTATGAAAA GTCTCCAGAG 
GGCATCGCGC GGGTGACCAT AAATCGACCC GAACGTAGAA ACGCGTTCAC GCCGCGAACG 
GTGAAGGAGA TGCGATGGTG CATGGACGAC GCGAGAGATG ATATGACGAT CGGGGTCGTG 
GTGATGCGCG GGATGGGAGA TCTGGCGTTT TGTAGCGGCG GCGATCAGAG CGCGAGGGGC 
GACGGCGGAT ACGTCGACGC CAAGGCGGGA GGAGCGGAGG AGACGCCGAG ATTGAATGTG 
TTGGACTTAC AGATGCAGAT ACGAAGGATG CCGAAACCCG TGATCGCGAG CGTGGCGGGG 
TACGCGGTCG GAGGAGGACA CATTCTGCAC ATGGTGTGCG ATCTGACCAT CGCCGCGGAT 
AACGCCGTGT TCGGCCAGAC GGGGCCAAAG GTGGGATCGT TCGACGCCGG TTACGGAAGT 
ACGCACATGG CGCGGTTGAT AGGTCAAAAG AAGGCGAGAG AGATGTGGTT CTTAGCGCGT 
TTATACAACG CGAGCGATGC GTTGAAGATG GGATTGGTGA ACACGGTGGT ACCTTTAGCC 
GAACTCGAGA CGGAGACGGC GGTGTGGTGT CGAGAGATTT TGCGCAATTC GCCGACGGCA 
ATTCGACTGT GTAAAAATGC ATTGAATGCG GCCGAGGACG GGCAAGCGGG CATTCAAGAT 
CTCGGTGGAA GCGCAACGCT GCTATTTTAT CAATCAGAAG AGGGTAACGA AGGTCGACGA 
GCGTTCTTAG AAGGGCGCAA GCCAGACTTT TCCAAGTTTA AACGATTTCC GTAG

Protein sequence

MDDARRRVAQ IANHVTAADD GFSRQTYARA DAARVSSYER VHGDVSRDPV SWVKCAPGAD 
ERSVASHYEL RDVIYEKSPE GIARVTINRP ERRNAFTPRT VKEMRWCMDD ARDDMTIGVV 
VMRGMGDLAF CSGGDQSARG DGGYVDAKAG GAEETPRLNV LDLQMQIRRM PKPVIASVAG 
YAVGGGHILH MVCDLTIAAD NAVFGQTGPK VGSFDAGYGS THMARLIGQK KAREMWFLAR 
LYNASDALKM GLVNTVVPLA ELETETAVWC REILRNSPTA IRLCKNALNA AEDGQAGIQD 
LGGSATLLFY QSEEGNEGRR AFLEGRKPDF SKFKRFP