Gene OSTLU_43511 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_43511
Symbol
ID	5006548
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009374
Strand	+
Start bp	118707
End bp	120098
Gene Length	1392 bp
Protein Length	442 aa
Translation table
GC content	55%
IMG OID	640421969
Product	predicted protein
Protein accession	XP_001422490
Protein GI	145356548
COG category	[C] Energy production and conversion
COG ID	[COG0644] Dehydrogenases (flavoproteins)
TIGRFAM ID	[TIGR01790] lycopene cyclase family protein

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.746424
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGATG ATCGCGAATG GATTGCGTTT CAACAGCGCA AGGTGTTTAG TGAGCAAAAG 
CAAATCAAAG AGTACCTCAG TGCTTTGAAC GACCGCGACA AGGTCGACGT TCTCGTTGTC 
GGTGCGGGCC CCGCAGGTCT GGCGATCGCA GCGGAGACGG CGAAGAAGGG TCTTTCTGTT 
GGTCTCGTCG CACCAGACAC CCCGTTCGTG AACAACTACG GAGTATGGCT CGACGAGTTC 
AAAGATCTAG GGCTCGAACA CTGCTTGCTT CATAAGTATG ACGACGCATT GGTTTGGTTC 
GATGATTCTG ATCCTGCGAG TGGAACTGAA CTCGGTCGAC CTTACGGTCA AGTGTGCCGC 
AGGCGTCTTC GCGACCATTT GTTGAAGGAG TGCGCGGCGG CTGGCGTCAA GTATTTACCA 
GGCCTGGTAG ATTTTGTGCG TCACGGTGAC GTCGAAAAGA ACGAGTTAGC CGAAGTTCGA 
GGCACCATCA TTAGCGATTC CGATATTACC GCAAGCGAGA AGAAGTTGAT CGAAGAAGAG 
GCAAACAGAG GCCAGCAATT CACGTTGAAT TCGCGTCTCG TCGTTGCCGG CACCGGTCAC 
AACCGCGACA TGCTCAGCTA CGAAGAGGGT GCGCCGCCGG GCTGGCAGAC TGCGTATGGC 
GTTGAGGTGC GCATTCCGAA CCACGGTTTT CCCGTGAACA AGGCCGTGTT CATGGATTTT 
CGTCAAAGCG ATCCGGAGGC GATGAAAGAG GAACAAGACG AGGGCGTTTG GCGCGTGCCG 
TCTTTCCTTT ACGTGTTACC CGTGGACAAG GATGTGGTGT TCGTCGAGGA GACGTGCCTC 
GTCGCGCGCG TACAAGTGCC GTTCGATGAA CTCAAACGGC GATTGTATCG TCGTATGAAG 
CGGATGGGTA TGGAAATCGT CGAAGAAGAC ATCTTGGAAG TCGAGGCGAG TTGGATTCCA 
CTGGGCGGTA CCCCGCCGGT TGCCCCGCAA CGCACCATCG CGTACGGTGC AGCAGCCGGC 
ATGGTCCACC CTGCGTCTGG CTACTCCGTC GTAAACAGTA TTAGCAAAGC TCCGCGTGTT 
GCGACGGCCA TGGCCGAAGG CTTGAAGGAG GGTGGCGAGA TTGAGGCGAG CCGAAGAGCG 
TGGGAAATCC TTTGGGGTGC GGAGCCACGA AGACAAATCG GTTTCTACCA GTTCGGTATG 
GAGCTTCTCA TGTCGCTTCG CATCGAGCAG ATGCGCAACT TCTTTAGTAC CTTCTTTGCG 
CTTCCAACAA ATCTGAGCAG AGGATTTTTG GGTAACAGAT TGTCGAGCTC AGAGTTGATC 
ATGTTTGCTC TCACTACGTT CGCAATTGGT AACAACGAAC TTCGTGGGTT GTTGCTCGCT 
CACCTGGTTT CA

Protein sequence

MKDDREWIAF QQRKVFSEQK QIKEYLSALN DRDKVDVLVV GAGPAGLAIA AETAKKGLSV 
GLVAPDTPFV NNYGVWLDEF KDLGLEHCLL HKYDDALVWF DDSDPASGTE LGRPYGQVCR 
RRLRDHLLKE CAAAGVKYLP GLVDFVRHGD VEKNELAEAN RGQQFTLNSR LVVAGTGHNR 
DMLSYEEGAP PGWQTAYGVE VRIPNHGFPV NKAVFMDFRQ SDPEAMKEEQ DEGVWRVPSF 
LYVLPVDKDV VFVEETCLVA RVQVPFDELK RRLYRRMKRM GMEIVEEDIL EVEASWIPLG 
GTPPVAPQRT IAYGAAAGMV HPASGYSVVN SISKAPRVAT AMAEGLKEGG EIEASRRAWE 
ILWGAEPRRQ IGFYQFGMEL LMSLRIEQMR NFFSTFFALP TNLSRGFLGN RLSSSELIMF 
ALTTFAIGNN ELRGLLLAHL VS