Gene OSTLU_35070 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_35070
Symbol
ID	5003561
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009363
Strand	+
Start bp	337727
End bp	338980
Gene Length	1254 bp
Protein Length	417 aa
Translation table
GC content	57%
IMG OID	640418982
Product	predicted protein
Protein accession	XP_001419562
Protein GI	145350327
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1222] ATP-dependent 26S proteasome regulatory subunit
TIGRFAM ID	[TIGR01242] 26S proteasome subunit P45 family

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.0746786
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACGAC TGACGACGAC GCGCGCGGTG TGCGATGACG CGCAGATGCC GGCGACGCAC 
GCGAACGCGA GCGGGGCGAC GACGACGAGC GAGGGATCCT CGACGACGAC GGATCTGTAC 
GCGCGACTCA AGTCGCTTCA ACGCGAACTG GAGCTGGTGG AGATTCAAGA GGAGTACATC 
AAGGATGAAC AAAAGAACTT GAAGATTGAA TTGCTCAGGG CGCAGGAAGA GGTGAAGCGG 
ATACAGAGCG TGCCGTTGGT GATTGGACAG TTTTTGGAGA TGGTGGACGC GGAGACGGGG 
ATCATATCGT CGACGACGGG GTCGAATTAT TACGTGCGGA TTTTGTCGAC GCTGAACCGG 
GAGCTGTTGA AACCGTCGAG CTCGGTGGCG TTGCACAGAC ATTCGAACGC GCTGGTGGAG 
ATTTTACCTC CCGAGGCGGA TTCGTCGATT TCTTTGTTGA GCGACGCGGA ACGGCCGGAT 
GTGAAGTACA GCGACATCGG GGGGGCGGAT GTGCAAAAGC AAGAGATTCG CGAGGCGGTC 
GAGCTTCCGT TGACGCACTT CGATTTGTAT AGGCAGATTG GAATCGATCC ACCGCGTGGG 
GTCTTGCTGT ACGGACCACC CGGGACGGGG AAAACGATGT TGGCCAAGGC GGTGGCGCAC 
CACACCACGG CGGCGTTTAT TCGCGTCGTC GGGAGCGAGT TCGTGCAGAA GTACCTCGGC 
GAAGGGCCGA GAATGGTGAG AGATGTGTTT CGATTGGCGA AGGAAAACGC CCCAGCGATC 
ATCTTCATCG ACGAGGTCGA TTCCATCGCG ACTGCGCGTT TCGACGCGCA CACCGGCGCG 
GATCGTGAGG TGCAGCGTAT TTTGATGGAG CTCTTGAACC AAATGGACGG ATTCGATCAA 
ACGGTCAACG TCAAAGTAAT CATGGCGACG AACCGTGCGG ATACCCTCGA TCCGGCGTTA 
TTGCGCCCCG GTCGTCTCGA TCGAAAGATT GAGTGCCCGC ATCCCGATCG TCGTCAAAAG 
CGTTTGGTGT TCCAGGTGTG CGTGAACAAG ATGAGCCTCA GCGACGAAGT AGATTTGGAG 
GATTACGTCA GTCGACCGGA CAAGATCTCC GCCGCGGACA TTCGCTCCAT CTGCCAAGAA 
GCCGGGTTGC AAGCCGTTCG GAAGAATCGA TACGTGGTTT TACCGAAAGA CTTTGAAGTC 
GCGTACAAGA CGAACGTGCG CAAACCTGAC AACGACTTTG AATTTTACCG ATAG

Protein sequence

MERLTTTRAV CDDAQMPATH ANASGATTTS EGSSTTTDLY ARLKSLQREL ELVEIQEEYI 
KDEQKNLKIE LLRAQEEVKR IQSVPLVIGQ FLEMVDAETG IISSTTGSNY YVRILSTLNR 
ELLKPSSSVA LHRHSNALVE ILPPEADSSI SLLSDAERPD VKYSDIGGAD VQKQEIREAV 
ELPLTHFDLY RQIGIDPPRG VLLYGPPGTG KTMLAKAVAH HTTAAFIRVV GSEFVQKYLG 
EGPRMVRDVF RLAKENAPAI IFIDEVDSIA TARFDAHTGA DREVQRILME LLNQMDGFDQ 
TVNVKVIMAT NRADTLDPAL LRPGRLDRKI ECPHPDRRQK RLVFQVCVNK MSLSDEVDLE 
DYVSRPDKIS AADIRSICQE AGLQAVRKNR YVVLPKDFEV AYKTNVRKPD NDFEFYR