Gene OSTLU_93034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_93034
Symbol
ID	5002725
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009361
Strand	-
Start bp	457100
End bp	458686
Gene Length	1587 bp
Protein Length	528 aa
Translation table
GC content	60%
IMG OID	640418146
Product	predicted protein
Protein accession	XP_001418938
Protein GI	145349019
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0651398
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.100945
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGGCGG CGAAGGCGGA GGAGGAAAAG ATTCGCAGTA CCGTTCGTGA ATTCATTTTG 
AAGGCGATGG AGATGGCGGC GGAGGAGACG AAAGCGAGCG GGCACGACGA AGCCAATGGA 
ACGCCGAGCG AAGTCGCCGC GGCGGTCGAA TCGGCGCTGT ATAAAAAATG CGGTTCGGCT 
GACAAAGAGT ACAGAACGCG CGCGCGGTCT TTAAAATCCA ACTTACAGGA CGTGCGCAAC 
CCTCAATTAC GGGCGCGCGT GCTCGCGAAC GATTTGAAAG CTTCACAACT CGTGGACATG 
TCTCCGCTGC AGTTGGCCAA CAAGGAGCTC GTCGAGTGGC GCAAGGCGCG ACAGGAAATC 
GCGGGCGAGG GTGCCTTTAT GAAGGGAATC GCGCTTGAGG ATATAGTGGT GAAGAAAGAT 
GGGAAGAATG AAATTCACGT CGAGCTGAAG CCAGAAGAAC CGGCGCCGTC GAAGCCCGTG 
GAACAAACGC CGAGCGTCGA GGAAGAGCCG ACGCAAGTCA CCGAGATTGA CGTGACGTCT 
GGGAACGACC AACTGTCAGA CGAGGAGCAC GAAGAAGCCG CACCGATGAA CGTCGACGGT 
GATGATTCAG AAATGCTTTC TTTCGAAAAG TTTGCGAATG GAGGCGAAGA AGACAAGGAA 
GAGGAGCAGG AAGAAGAGGA AGACGAGGAA GACGCCGCGC CGGAATACGA GCCAGAGCCC 
GAGTACGAAC CGGAGGACGA ACCTGAGTAC GACCCGGAAG CGACTACGGC GGATGAGGTG 
GAAGAAGAAG AATACAATCC CGCCGACGAC CCGATAGATG TTCCTCTTCC CGAAGGTGCG 
TGGGAAGGCA CCGTAGATGT TCCAGGACTG CCTACGCTTC AGCTGCGAGC GGTGCCCATC 
GGCGGCGAAG GCGCCCACGT CGGCGACATC TTGCCCGAGA GTTTGCACAT CAAAGGCCGC 
GTCGACTACA AAGCCATGCA ATCTTTCGTC AAGCAAGTCC ACCGCTCGTC GACGTCGCGC 
GCGGTGACGC TCGTGCATAT CTCGAGCGCG CCGAGCGGCG GAGACGACGC GGAAGCGGCG 
ATGGCGAAGA TCGTCAAACA ATATCGCGAG CGCAAGCGAT GCGGCGTGGC GAAAACGGAG 
GATGGCATCG AGCTGTATCT CGCGCCTCGC GGTCAGCACG CGGATAAAGT CATCTTAACC 
GTCGACCTTA TCCCGGGACA CGTCCCACCG TCGACGGGGA TGATTGGAAT GGTGATTCAT 
CCGCGAGGCA TCGGTCCAAG GAAAGTCGAC TCGAAGGAAC TTCATCGATC AAAGAAGACG 
CGCGTCGAAG AGCACGTCGA CGAGGATGAG TACGCGCCCA ACGCGCCACC GGCGCAATTC 
ATGGAGGTTC CGCCACCACC GCCACCCTCA GCGCAGATGG CGCCGCTCGC GCCCCCCCAA 
ACTCTTCGAG AAGTTCCCCC GCCGCCGCCG CCCGCCGCCG CGCCGCCGGC GTTCCAAGCG 
CAAGATCTCG CCGGTTTGAT CGCGACGCTT TCCGGCGCCC AGCAACCGGT GCGCATGAAC 
GTACCACCGC CTCCTCCTCC TCCGTGA

Protein sequence

MEAAKAEEEK IRSTVREFIL KAMEMAAEET KASGHDEANG TPSEVAAAVE SALYKKCGSA 
DKEYRTRARS LKSNLQDVRN PQLRARVLAN DLKASQLVDM SPLQLANKEL VEWRKARQEI 
AGEGAFMKGI ALEDIVVKKD GKNEIHVELK PEEPAPSKPV EQTPSVEEEP TQVTEIDVTS 
GNDQLSDEEH EEAAPMNVDG DDSEMLSFEK FANGGEEDKE EEQEEEEDEE DAAPEYEPEP 
EYEPEDEPEY DPEATTADEV EEEEYNPADD PIDVPLPEGA WEGTVDVPGL PTLQLRAVPI 
GGEGAHVGDI LPESLHIKGR VDYKAMQSFV KQVHRSSTSR AVTLVHISSA PSGGDDAEAA 
MAKIVKQYRE RKRCGVAKTE DGIELYLAPR GQHADKVILT VDLIPGHVPP STGMIGMVIH 
PRGIGPRKVD SKELHRSKKT RVEEHVDEDE YAPNAPPAQF MEVPPPPPPS AQMAPLAPPQ 
TLREVPPPPP PAAAPPAFQA QDLAGLIATL SGAQQPVRMN VPPPPPPP