Gene OSTLU_4555 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_4555
Symbol
ID	5000641
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009357
Strand	-
Start bp	839408
End bp	840469
Gene Length	1062 bp
Protein Length	354 aa
Translation table
GC content	59%
IMG OID	640416062
Product	predicted protein
Protein accession	XP_001417069
Protein GI	145345117
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG5043] Vacuolar protein sorting-associated protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGAGC AGTACCTCGC CGACGCCCTG AATAAGGCGC TCGGCGCGTA CTGCGACGGC 
ATCGACGGCG AGAAACTGCG CGTGTCCGCG TGGAACGGCG ACGTCGAATT GCGAAACGTT 
CGTCTGAAAA AAACGGCGCT GTCGACGCTG CGCGCGCCGG TGACGGTCGA CGCGGGATGC 
GTCGGGTCGC TGCGGTTGAA GGTGCCGTGG ATGAACCTCG GACGCGAACC GGTGGTGGTG 
GAGATCGATC GAGTGTTCGT GCTGGCGTCG AGGGTGACGA TGGAGGAGGC GGCGGCGACG 
GCGGACGAGA CGCGAGACGA GGAGGAAGAC GCGGCGGAGA AGAAGAAACG AATCGATGAG 
GGAGAGCGAG ATTGGTTGAG GACGGCGATG GGGAAGATGA CGAAGACGAT GCGGGAGGAG 
GCGGAGAGAT CGGATAGTTG GTTTTGGAAG ACGTTAAACA CGGTGCTGGG AAATTTACAA 
ATAACGGTGC AAAACGTACA CGTGCGGTAC GAGGATGAAA TCACGACGCC TGGGCACACG 
TTTTCGTGCG GAATGACGAT AGGAAAGTTG AGCGCGATCA CGGTGGATGA TTTTGGGGAG 
CCGACGTTCG TCGCGGGAGG GTCGCTGGAA CGCATTCACA AGCGCGTGGC GTTGGAAAAC 
TTTTCAATGT ATCTCGACTC GGGGGCGGTG TATCGACCGT GGAAAACGCA CGCGGGATGG 
ACGCCGCCGA AAGTGGAAGA CACAGAGGCG TGGTGGGCAC TATTTGGCGT AGGGTTGGTC 
GGAGAAGCGC CGAGCGATGT GCGAAACTAC ATGTTGTACC CGGTGACGGT GGAACTGTTT 
TATCACCGCA AAGGACGAAA AGAACAAACC GAGGCGGGTG AACCGAGGCA AATGTGTGAC 
TTGAAGTTTC AAGACGCGCG CATGGCGTTG AGTCGTAATC AATACCGCAG TACGGTCCGC 
TTGCTAGAGG CCTTCAATCA GTATCGCTTG CGATTGCCGC ACGCCGAGTT TCGCCCGATG 
GTGAGCGTCA AAGCTCAACC GCGCGCGTGG TGGACGTACG CC

Protein sequence

MFEQYLADAL NKALGAYCDG IDGEKLRVSA WNGDVELRNV RLKKTALSTL RAPVTVDAGC 
VGSLRLKVPW MNLGREPVVV EIDRVFVLAS RVTMEEAAAT ADETRDEEED AAEKKKRIDE 
GERDWLRTAM GKMTKTMREE AERSDSWFWK TLNTVLGNLQ ITVQNVHVRY EDEITTPGHT 
FSCGMTIGKL SAITVDDFGE PTFVAGGSLE RIHKRVALEN FSMYLDSGAV YRPWKTHAGW 
TPPKVEDTEA WWALFGVGLV GEAPSDVRNY MLYPVTVELF YHRKGRKEQT EAGEPRQMCD 
LKFQDARMAL SRNQYRSTVR LLEAFNQYRL RLPHAEFRPM VSVKAQPRAW WTYA