Gene OSTLU_42820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_42820
Symbol
ID	5003131
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009362
Strand	+
Start bp	602313
End bp	603611
Gene Length	1299 bp
Protein Length	432 aa
Translation table
GC content	56%
IMG OID	640418552
Product	predicted protein
Protein accession	XP_001419216
Protein GI	145349598
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.246102
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTGATG AGGCGAGCAA GACGGCGAAG ATTGAGAGCG CCGCCGAGTC GAAAATCGAC 
TTGTATAGGG ATCGGTTCTT GTTGTTGCAG CAGCGCTTGT CGCGGTCAAG GCAGTTCGCG 
AAGCCGACGT TGCAGACGTC CTCGACCGAG GGCATCGCGG AGTTGACGTC GATTCAGTCG 
TTGTTAGGGG TGAGCAAGGA GACGAAGTTT ATCATGGGAT GTTTGAGTCA ATTGGAGGAC 
GAACGGTTTT ACATGGAGGA TTTGACGGGG ACGGTGCGAG TTGATTTGAC GGCGTGCGAG 
CGCAGCGCGG GGTTGTTCAC GGAGAATTGC ATCGTGATCG CGCAGGGTGA GGTGCGACCG 
GACGGGGTGT TTGAGGTCAT GGCGTTGACG TTTCCCCCGG CGGAGACGCG AGCGGCGACG 
AGAAACGCGA CGAACGCTTT GGATTTCTTC GGCGCGGGGC ACATCTTGCG ACCGAACGAG 
CTGGAGGAGC TCGAAGAGAA GGAACTTGAA CGCGTCGGTG AGAGGTTTAT CGTGTTGTCG 
GACGTTTGGC TCGACCAACC ACGCACTTTT GATAGATTGG CAAAAATGTT TGACGCGTTT 
GACTCGCAAG AGGAAGACGT GCCGGGATTG ATTGTCTTCA TGGGAGATTT CACATCGAAA 
CCGTTCGGCC CGACGCACTA CGACTTTCGC GCGTATACCG AAGGCTTTGA CAAACTCGCG 
GAGTTGCTGG AGGAATATCC GCGCTTGCGA CAGGAAAGTC GGTTCGTCTT CATCCCTGGT 
CCGGGCGATC CCGGTTTGAA CGCCGCGCTT CCGCGCCCGG GATTGCAATC ATCCGTCATC 
GGTTCTCTGC TGGAGAAGGT TCCGCGCGCG CAATTCGCGA GTAACCCGGC AAAAATTAGA 
TACTTTTCGC AAGATCTCGT GTTCTTTCGC GACGACTTGC AGGCGAAGAT GCGCAGAAAC 
TGTTTGATGC CGCCCGACGA CGATAAACTG CCGGAAATCG CGCCCGGCGA CGAGTGGGCG 
AACCGCCCGG TGTTCAAGCA TCTCGCGGCT ACCATGGTGC AGCAGGCGCA CTTATGCCCG 
TTACCGATCA CACAAAGCCC GATTTATTGG GAATACGACC ACTCGTTGTG GTTGTATCCG 
GCGCCAAACT GTATTTTCTT AGGCGATCGA ACCGAGCAAC AATCGCTGGC CAACTTTGAG 
GAGACTTCGC TCGCGAATCC CGGATGCTTT TCCGACGACG GGTCGTTCTT GCTGTACATC 
CCCGCCACGG GTGAGTGTTC GTTCTCAGCC GTGCCGTGA

Protein sequence

MFDEASKTAK IESAAESKID LYRDRFLLLQ QRLSRSRQFA KPTLQTSSTE GIAELTSIQS 
LLGVSKETKF IMGCLSQLED ERFYMEDLTG TVRVDLTACE RSAGLFTENC IVIAQGEVRP 
DGVFEVMALT FPPAETRAAT RNATNALDFF GAGHILRPNE LEELEEKELE RVGERFIVLS 
DVWLDQPRTF DRLAKMFDAF DSQEEDVPGL IVFMGDFTSK PFGPTHYDFR AYTEGFDKLA 
ELLEEYPRLR QESRFVFIPG PGDPGLNAAL PRPGLQSSVI GSLLEKVPRA QFASNPAKIR 
YFSQDLVFFR DDLQAKMRRN CLMPPDDDKL PEIAPGDEWA NRPVFKHLAA TMVQQAHLCP 
LPITQSPIYW EYDHSLWLYP APNCIFLGDR TEQQSLANFE ETSLANPGCF SDDGSFLLYI 
PATGECSFSA VP