Gene OSTLU_41266 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_41266
Symbol
ID	5002224
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009360
Strand	-
Start bp	283110
End bp	284270
Gene Length	1161 bp
Protein Length	386 aa
Translation table
GC content	60%
IMG OID	640417645
Product	predicted protein
Protein accession	XP_001418431
Protein GI	145347969
COG category	[R] General function prediction only
COG ID	[COG0724] RNA-binding proteins (RRM domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0574303
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0646612
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CGACGCGTTC GAGGCGTCAT GTCGGACGAA TCCGAGGCCA GGGAATTCCC GGTGGTGTGC 
GAGGACTGCC TCGGCCCCAA CCCGTACGTG CGCGTGCAAA AGATGCCGCT CGGCGGCGAG 
TGCGCGATCA GCGGTCGCCC CTTCACCGTG TTTCGCTGGC GACCCGGGAA CGAGGCGAGG 
TACAAGAAGA CGGTGGTGTG CAAAGAGATC GCGCAGGCGA AGAACGTGTG CCAGGTGTGC 
CTGCTGGATT TAGATTACGG GATACCCGTC GCCGCGCGGG ACGCCGCGCT GGGACGCGCG 
GGAGGGAGCG CGCTGCCGTC GAGCTCGGTG AACCGGGATT TCGCGGTGAA TGAGATCGCG 
AAAAAGCTGG ACGAGGGCGA GGACGCGTAC GAGAAGGATG GGAAGGAGAA AAATAACGAA 
CTGTTGATGC GGTTGGCGAG GAAGAAGCCG TATTATAACA AGAATAAAAC GCCGATATGC 
ACGTTTTGGT TGAGAAACGC GTGCACGAGG AACGATTGTC CGTATCGACC TTGCAACGGG 
GATACGCACA TGCCGGAACT GAGCGCGGCG CCAGAGTTGA GAAAGCAAAA TATTAAGGAT 
AGATACTTCG GGACGAACGA TCCGGTGGCG GAACAAATGC TCAAACGCGC GAAAGAGCGA 
CCGAGCCAAA AGTTGACGCC ACCCGAAGAT GCGAGCATCA CCACGTTGTT TGTAGGCGGC 
GTCGACCCGG AAAAGGTCAC CGAGGACGAC ATCAACTCGC GCTTCTATCA GTACGGCGAA 
ATCAAGGGCA TTCGCGTGAT TGGGACGAAG AAATGTGCGT TCATCACTTT CGCCACGCGC 
GAAGGTGCGG AGAAGGCGGC GGAAGATGCG GCGATAAATC TCGAAATCAA CGGAGAGCGA 
TGCCGACTCC AGTGGGGCAA GTCGGCGGCG AAAAAAGCGA GCGGCAACCA AGGGTCTGCG 
CCGGCACCGC CACCAACCGT GATGATGATG GCTCCAGGTG TGGAAGCTCC AGCGAATGGG 
CAGGCTTTAC CGCCAGATAT GCCGGCGCAT GTGGCGATCC CCATGCCTGC GCCGGCCGCG 
GTGGGGCACG CGACCAAGTA CCCGTCGATG GATCCTTCGC AGATGGGAGC GGTTTCAAAG 
AAGCAGGAAG CCGAGAAGTA G

Protein sequence

RRVRGVMSDE SEAREFPVVC EDCLGPNPYV RVQKMPLGGE CAISGRPFTV FRWRPGNEAR 
YKKTVVCKEI AQAKNVCQVC LLDLDYGIPV AARDAALGRA GGSALPSSSV NRDFAVNEIA 
KKLDEGEDAY EKDGKEKNNE LLMRLARKKP YYNKNKTPIC TFWLRNACTR NDCPYRPCNG 
DTHMPELSAA PELRKQNIKD RYFGTNDPVA EQMLKRAKER PSQKLTPPED ASITTLFVGG 
VDPEKVTEDD INSRFYQYGE IKGIRVIGTK KCAFITFATR EGAEKAAEDA AINLEINGER 
CRLQWGKSAA KKASGNQGSA PAPPPTVMMM APGVEAPANG QALPPDMPAH VAIPMPAPAA 
VGHATKYPSM DPSQMGAVSK KQEAEK