Gene OSTLU_49403 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_49403
Symbol
ID	5001409
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009358
Strand	-
Start bp	300339
End bp	301769
Gene Length	1431 bp
Protein Length	332 aa
Translation table
GC content	57%
IMG OID	640416830
Product	predicted protein
Protein accession	XP_001417471
Protein GI	145345971
COG category	[R] General function prediction only
COG ID	[COG2319] FOG: WD40 repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	0.220793
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CGGTCGACGC GCTCGACGCG GTCGACGCGA GCGAGGCGCG CGCTTCGAGC GACGCGAAGG 
CGTCGGACGC GAACGCGAAG GCGTCGAGCG CGAACGCGGG ACCCGACGGG CGGTGAAGGC 
GCGCGACGAA AGACGAGGAA GGCGCGCGCG AACGATGAAC GCGGAGAAGA GGGCGGAAAT 
ATACACCTAT GAGGCGCCGT GGATGATCTA CGCGTGCAAT TGGAGCGTGC GTGGCGAGCG 
AGGCGATGGA TTGGGGGCGA GCGCGGGAGA ATTGAATCGC GAGGGGCGAC GGAGGAGACG 
CGACGGAGGA GACTCGGGGA CGCGCGCGAA CGGTCGATCG GAGATTAAAA ATGGAGACGC 
GCGAGTGAAG ACGCGAATGG CGTGGACTGA CGACGTCGAA TTGAACGCGA CAGGTTCGAC 
AAGATAAACG CTTCCGCCTC GCCTTGGGTT CGTTCGTGGA GGAGTATAGC AACAAGGTTG 
AGATCATCAC CTTGGACGAG GAAACCGGGG AGTTTCCGAA GGAGGCGCAG TGTTCGTTCA 
CGCATCCGTA TCCTTGCACG AAAATTTTGT TCATTCCGGA CAAGGAGTGC ACGAAGGAGG 
ATTTGTTAGC GACGACGGGG GACTACTTGC GAATCTGGCA AGTGCAGGAT GATAACACGG 
TGCAGATGAA ATCTTTACTG AATAATAACA AGAGCAGCGA ATTTTGCGCA CCGCTGACGA 
GCTTTGATTG GAACGAGACC AAGCTTCAGC GAGTGGGGAC GTCGTCGATC GACACGACGT 
GTACGATTTG GGACATCGAG CGCGAGTGCG TGGACACGCA GCTCATCGCG CATGATAAGG 
AGGTGTACGA CATCGCGTGG GGTGGTCCAG AGGTTTTCGC TAGCGTAAGT GCGGATGGAA 
GTGTGCGAGT TTTCGACTTG AGAGACAAGG ATCACAGTAC GATCATTTAC GAGAGTCAAA 
CTCCAGACAC GCCGCTGCTG CGTTTGGGGT GGAACAAGCA GGATCCGAGA TACATGGCCA 
CCATTTGCAT GGATAGTCCG GTGATCATTC TCGATATTCG CTTCCCGACG TTGCCGGTCG 
CAGAACTTCA GAGTCACAGA GCGAGCGTGA ATACATTGGC GTGGGCGCCA CACAGCTCAA 
GCCACATGTG CACGGCGGGC GACGACAGTC AGGCGTTGAT TTGGGATTTG TCGTCCATGA 
ATCAACCACC CGAAGGCGGT CTCGACCCTA TTCTCGCTTA CTCTGCTGGA GCAGAAATCA 
ATCAGTTACA GTGGAGCGCG TCGCAACCGG ATTGGATCTC GATAGCTTTC CGAAACAGCC 
TCCAGATCCT CCGAGTTTAG TCAACGCGCT GTCAGGTCTG CGCCGACGCC ACTGTATATT 
ACCCGAATTT CCGGATACGC GACACACGAC ACACGACACG CACGCACGTA G

Protein sequence

MNAEKRAEIY TYEAPWMIYA CNWSVRQDKR FRLALGSFVE EYSNKVEIIT LDEETGEFPK 
EAQCSFTHPY PCTKILFIPD KECTKEDLLA TTGDYLRIWQ VQDDNTVQMK SLLNNNKSSE 
FCAPLTSFDW NETKLQRVGT SSIDTTCTIW DIERECVDTQ LIAHDKEVYD IAWGGPEVFA 
SVSADGSVRV FDLRDKDHST IIYESQTPDT PLLRLGWNKQ DPRYMATICM DSPVIILDIR 
FPTLPVAELQ SHRASVNTLA WAPHSSSHMC TAGDDSQALI WDLSSMNQPP EGGLDPILAY 
SAGAEINQLQ WSASQPDWIS IAFRNSLQIL RV