Gene OSTLU_35655 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_35655
Symbol
ID	5002888
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009361
Strand	-
Start bp	584222
End bp	585388
Gene Length	1167 bp
Protein Length	388 aa
Translation table
GC content	66%
IMG OID	640418309
Product	predicted protein
Protein accession	XP_001418978
Protein GI	145349100
COG category	[A] RNA processing and modification
COG ID	[COG0430] RNA 3'-terminal phosphate cyclase
TIGRFAM ID	[TIGR03400] 18S rRNA biogenesis protein RCL1

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.286653
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0571099
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCCCT CCCGCGCGCC CGCGCGCTTC ACCGGCGCCA AGGACTTCCG CGCGCGCATC 
CTGATCAGCG TCCTGAGCGG TAAGCCGTGC GTGATTCGCG ACATTCGCGT CAAAACCGCC 
GCGCGAGGCG GCGGTGACGA CGCCGTCGGG CTGCGCGATT ACGAAGTCTC GCTCCTGCGC 
CTGATCGATA AGCTCACGAA CGGCACGCGC GTGGACATCA GCGAAGACGG CACCGCGGTG 
CGGTTCGACC CGGGCGTGGT GAAGGGAGGA CGCGCGCTGA CGCACGAGTG CGCGACGAGC 
CGGGGCGTCG GGTATTACGT CGAGCCGACG CTGGCGTTGG GATTGTTCGC GAAGAAACCG 
ATCGAATTGA CGCTCATGGG GGTGACGAAC GACGACGCGG ACGTGAGCGT GGACGTGTTT 
AGGACGGTGA CGCTGCCGAT GCTGAAGAAA CACTTCGGCG TGGACGATGG ATTGGCGCTG 
GAGGTGGAAC GGCGAGGGTG TCCGCCGAAC GGCGGCGGTC GCGTGCGGTT GACGTTGCCG 
ATTGTGAAAA CGCTGCCGAC GCTGGATTGG TGCGACGAGG GCTTGGTGAA ACGGGTGCGA 
GGGGTGACGT TTACGTGCAA GGTGTCGCCG CAGAATGGAA ACCGCATGGT GGACGCTGCG 
AGAGGGGTGT TGAACGCGTT CATTCCAGAC GTGTACATTT TCACCGACCA TCACGTCGGT 
CCGGAGGCGG GGAAGAGCCC AGGGTACGGA TTATCCCTCG TCGCCGAAAC CACCACGGGT 
TGCGTGCTCG GCGCCGACGC CGCGTCCACG GCGTGCGCGT CCGCGATGAG CGAGGCGGCG 
GATTTAGAAT GGGCCGACGA CGCCGAGGCG CGCGTGCCCG AAGACGTCGG CCGCCGCGTC 
GCCGAGGCGC TCGTCGCCGA GATCCAACGC GGCGGCGTCG TCGACAGCAC CCATCAATCC 
CTCGCCCTCA TCCTCCTCGC CATCGGTCCC GAGCAAGTGT CCAGAATCCG TCTCGGTCAG 
CTCACCCCTC GAGCGATCGA AACCTTGCGC GCGCTCAAAG CCTTCTTCGG CGTCACCTTT 
CACGTGCAGC CCGAGCCCGA GAGCGGCACC GTGTTCTGCT CCGTCGTCGG CGTCGGTCTG 
AAGAACGTCG CCAGGCGCAG CACGTGA

Protein sequence

MPPSRAPARF TGAKDFRARI LISVLSGKPC VIRDIRVKTA ARGGGDDAVG LRDYEVSLLR 
LIDKLTNGTR VDISEDGTAV RFDPGVVKGG RALTHECATS RGVGYYVEPT LALGLFAKKP 
IELTLMGVTN DDADVSVDVF RTVTLPMLKK HFGVDDGLAL EVERRGCPPN GGGRVRLTLP 
IVKTLPTLDW CDEGLVKRVR GVTFTCKVSP QNGNRMVDAA RGVLNAFIPD VYIFTDHHVG 
PEAGKSPGYG LSLVAETTTG CVLGADAAST ACASAMSEAA DLEWADDAEA RVPEDVGRRV 
AEALVAEIQR GGVVDSTHQS LALILLAIGP EQVSRIRLGQ LTPRAIETLR ALKAFFGVTF 
HVQPEPESGT VFCSVVGVGL KNVARRST