Gene OSTLU_33394 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_33394
Symbol
ID	5003726
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009363
Strand	+
Start bp	145834
End bp	147012
Gene Length	1179 bp
Protein Length	392 aa
Translation table
GC content	53%
IMG OID	640419147
Product	predicted protein
Protein accession	XP_001419502
Protein GI	145350199
COG category	[S] Function unknown
COG ID	[COG2850] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.551934
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAGAGT ATTGGCAGAA AAAGCCTCTG CTGATGCGGC AGGCGATACC GAACTTTCGA 
CCGCCGCTGG ATGGGAACGA AATCGCTGGT TTGGCGTGCG AGGAGGACGC GAGCGCGCGC 
ATCTTCGTGC GCGAGGGGGA CGACGAGCAG TCGTGGAGGA AGAAGATTGG ACCGTTCGAA 
GAAAGTGATT TGACATCCTT ACCCGAAGAC AAGCCGTGGA GCCTGATCGT TAACGATTTG 
GACGTGCAGG CGCAACCGTT TGGGGACATG TTGGAACTCT TCAACTGTTT TCCGCGTTGG 
CGAATTTCTG ATATTCAAGC GAGCGTATCA CCGGACGGCG GGGGCGTAGG ACCGCACTCC 
GATCACTTTG ATGTATTTCT TCTTCAAGCC GAAGGCGAAA AAGTTTGGGC CGTGGCGGAT 
AACGAGGAGT ACTGGCCAGA TAATGATGCG GCATTTGTCC CAGAATGTGA AATTCGCGTG 
CTCAAAAGCT TTGTCGAGGA CGATTCCTTC ACGTTGGTTC CGGGTGATAT GCTTTACTTG 
CCCCCCAAAA TCGCTCACAA CGGCGTGGCG ACGAACTCAA AACCAGGCGT GAGCGTAACG 
TTGAGTATAG GCTTTCTAGC GCCGACGACG GATGAACTCG TCTTGTCTTA CACGCAACGA 
GCATCTGAAA AATTGAAGGG CTCGCGTTGG TCCGATCCTT GGCTCAAACC GGTCGAAGAC 
GTCGGTGCAA TATCCGCTGA ATCTATCACG TATGCATCGG AGATAATTAA GCGCACGTAT 
CCGAAGAATG ATGCCGAAGT GGCGCGTTGG TTTGGTTGTC ACACGACGGC GCGCACCGGC 
GAGGACGACG ACGCGGACGA GAACGAAGTG AGCATCGAAG AACTATTAGC GGCTTGGGAA 
CACCAAGGTC TAGTCGCGAG AGAAGATTTA CGCTTCGCTT TCGTGGAAAA GGTTGCGGAT 
GATAGTTTGA AGAACGCGCT GTTTTTCGCA AACGGAGAAT GTTGGGATGT CGTCAGCCCG 
GCCGCTGTGA AAACAGCCAC CGTCATCGCA AATAGAGGCG AGCTTTACGA AGAAGACACG 
CAGACGGAGG AGTGTGATTT CGATGATGAA GCCTTAAAGC TCGCACTAAC GCTATTTGAG 
CGTGGTTATC TCTATTTCCC CGAGGATGAA GACGATTAA

Protein sequence

MREYWQKKPL LMRQAIPNFR PPLDGNEIAG LACEEDASAR IFVREGDDEQ SWRKKIGPFE 
ESDLTSLPED KPWSLIVNDL DVQAQPFGDM LELFNCFPRW RISDIQASVS PDGGGVGPHS 
DHFDVFLLQA EGEKVWAVAD NEEYWPDNDA AFVPECEIRV LKSFVEDDSF TLVPGDMLYL 
PPKIAHNGVA TNSKPGVSVT LSIGFLAPTT DELVLSYTQR ASEKLKGSRW SDPWLKPVED 
VGAISAESIT YASEIIKRTY PKNDAEVARW FGCHTTARTG EDDDADENEV SIEELLAAWE 
HQGLVAREDL RFAFVEKVAD DSLKNALFFA NGECWDVVSP AAVKTATVIA NRGELYEEDT 
QTEECDFDDE ALKLALTLFE RGYLYFPEDE DD