Gene OSTLU_36158 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_36158
Symbol
ID	5000470
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009356
Strand	+
Start bp	854974
End bp	857004
Gene Length	2031 bp
Protein Length	618 aa
Translation table
GC content	56%
IMG OID	640415891
Product	predicted protein
Protein accession	XP_001416271
Protein GI	145342788
COG category	[J] Translation, ribosomal structure and biogenesis [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG5117] Protein involved in the nuclear export of pre-ribosomes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCAG AGGCGCGACG CGAGAGCGTC AAGGTACGAA TTGCGTCGAC GTGTCAGAGC 
GTCATCGAGG ATCCAGAGTC GAAGTGGAAA GAGCTCAAAG ACATCGGCAC GCTTTGTGAA 
GACCGAGACT CGGAAATCGC TCGATTAGCG TCGCTATCGC TCACCTTGGT CTACCGCGAC 
ATTTGCCCGG GCTATCGCAT TCGACCTCCG ACGGAAAAGG AGTTGTCCAT GAAGGTGAGT 
AAAGACGTGC TCAAGACGCG CGCTTTCGAG ACGGGCTTGC TTGAGCACTA CAAGTCGTAC 
GTGAAAATGC TAGTGAGATG CTCTGGGGCG AAGAAATCTC GCGCACAGCG TGGCAAAGGC 
GGACCAGATG CGGAGTCTGC GATCAAGTGT TTGTGCGCCT TGCTCATCGG ATTGCCGAGC 
TTCAACTATC GCACGGATAT TTTATCCGCC ATCGTGCCCG TCTTCGATAA GCGAGACACC 
AGTCACGCGC AGATCGTCAC TGATGCTCTG GTTGAGGTCG TGTCTAACGA CATTCGCGGC 
GATCTCACGC TCGAGGCGTT GCACATGACG GCGCAGCTCG TGAAGCAGAG TAAATGCAAC 
ATTCAGCCGT GCGCGTTTGC GTACTTCCTC AAGGTTCGCT TCGATGAGGG CATATTAGTG 
CCTATGGTGC GTGACAGGAA AGAAATTCTT TCTCGTAAGC AGACGTTCAA GAAGAAGCAG 
GAAGAGCGTG ATAAGATTCG CAGAGCTCGC GCGGAGAAGA CGAGGAAGCA ACAAGACAAG 
GAACGCATGA AATCATTCGG GCACGTCGCG GACTCTTCAG ACGATAGCGA AGACGAAGAG 
GCGGCGTTTC ATCGAGATTT AGACGAAGGT TCAGCGGTGA TGAGTTTCGG CGAGAAGAAA 
AAAACGCAGA GTCGATTATT AGAGGCGACT TTCGAGATGT ACTTTCGCGT ATTGAAGAAC 
GCCGCGAGTC CGGCGCCGAC GCCCGGGTTG CCGCTCTTGA GCGCCGCGCT CACGGGTTTG 
GCAAAGTTCA CGCATTTAAT CTCCATCGAT TTCTTGGGTG ATCTCATGGA AGTGTTTAGA 
AAGTTATTGG CCCAGGAAGA CTTGCTCTCG GACGCGCTCA AGGCGCAAAC TTTGCTGACG 
GCGTGTGAAA TTTTGAGCGG TCACGGAGAG GTTTTGCAAG TGGATACCGG GGAATTCTAC 
CGTCAGCTCT ATACGATGCT CGGCAAGCCC AGCGTAGGTG CAGCGGGGTG GCAAGATGGT 
ATGTCTATAA CCGATCAACG CGCGCTCAAT CACGGCACGC TGCGCGTTCG TGCCATTCAA 
AAGTTCATCG GCGGTTTCAA GCAAGTCGAT CAAGCACGCA TGGCGGCGTT TTCCAAGCGC 
CTCACCTCGG CGTCGATCGG CATGGAAGCT GGCGAATGCC TGGGTTCGCT CGGTGTCGTC 
CGCCAAATTC TCGCGTCGTA TCATCGCGTG CGTAACTTGC TCGAGAACGA GCGGATTGGG 
AACGGAGTGT TTCAGATGGA TTTAGACGAT CCCGAGCACG CACAAGGCAT GTCCGCCGTG 
CTCTGGGATC TTTGTCTACT TTCGCAACAC TACCATCCCA CGTGCGCGGC GGCGGCTCAC 
GAGGTTGCCA ATTTACCACT CTCGGGCGCG ATAGCTCCAC CTCCCGGCTC ACACGCCCCG 
AGCGAGCTCG CAAAGGCGTA CTCCACGCTC CGTGGAGACT TCAACCCGCC GATTCCCGAG 
CCGCCGACGC AACGCAACAA ACCGCGAGCG CCGATCGATC AGAAAAAGTT CGTCGACGCC 
TACGACGAAT CTTTCAAACG GAACGTCATC AGTAAGCTCG GCGACACCGT CGACACCGTC 
GAAGCGCGTG CGTTCCGCCG ACATTTCCGT CGCGTTCGAG CGCACGGGGA AAACTTTCGG 
TTACGAAGGG AGCGCGACGC CCTCGCGCGA AAAATTAGCG CCATGCGCGC GCACGAGCTC 
GAAGCCAAGT CGAAGTCGAA ATCTAAAAAA TCGTCGTCCA AACGCACGTA G

Protein sequence

MSAEARRESV KVRIASTCQS VIEDPESKWK ELKDIGTLCE DRDSEIARLA SLSLTLVYRD 
ICPGYRIRPP TEKELSMKVS KDVLKTRAFE TGLLEHYKSY VKMLVRCSGA KKSRAQRGKG 
GPDAESAIKC LCALLIGLPS FNYRTDILSA IVPVFDKRDT SHAQIVTDAL VEVVSNDIRG 
DLTLEALHMT AQLVKQSKCN IQPCAFAYFL KVRFDEGILV PMVRDRKEIL SRSAVMSFGE 
KKKTQSRLLE ATFEMYFRVL KNAASPAPTP GLPLLSAALT GLAKFTHLIS IDFLGDLMEV 
FRKLLAQEDL LSDALKAQTL LTACEILSGH GEVLQVDTGE FYRQLYTMLG KPSVGAAGWQ 
DGMSITDQRA LNHGTLRVRA IQKFIGGFKQ VDQARMAAFS KRLTSASIGM EAGECLGSLG 
VVRQILASYH RVRNLLENER IGNGVFQMDL DDPEHAQGMS AVLWDLCLLS QHYHPTCAAA 
AHEVANLPLS GAIAPPPGSH APSELAKAYS TLRGDFNPPI PEPPTQRNKP RAPIDQKKFV 
DAYDESFKRN VISKLGDTVD TVEARAFRRH FRRVRAHGEN FRLRRERDAL ARKISAMRAH 
ELEAKSKSKS KKSSSKRT