Gene OSTLU_4044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_4044
Symbol
ID	5002361
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009360
Strand	+
Start bp	186566
End bp	187552
Gene Length	987 bp
Protein Length	329 aa
Translation table
GC content	55%
IMG OID	640417782
Product	predicted protein
Protein accession	XP_001418174
Protein GI	145347440
COG category	[R] General function prediction only
COG ID	[COG0561] Predicted hydrolases of the HAD superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.000894209
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.644992
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GAGGTTTTCA CGAAGGTGGA GACGTGGATC GACGAGGTGC TCGAGCTGCC GAAAGAGAAG 
CGGAGGTTTA GTAAGCTTTC GAGAATGGTA CCCGCGGTTG GGTTTTTCTT CCACCGCTTG 
CCTTTGTTGA AGGCGCTGCG AGAGTACGAC GAGTTTTCCT CGTTGTCCAA GCGGCGGTAC 
GTGCTTCCAA ACTTTGCCGA GGTGCGGCAC ATTTTGAACA TCGCGCAAGT GCACGCGTCG 
AGTAAGGACG TGCGGTTGGT GACTTTCGAT GCCGATGGAA CGTTGTACGC CGACGGTGAG 
CACTTTGAGG ACGATAATAA GATGATCGAT AAGATTATGC AGCTCATGGA GTTGGGCATT 
CACGTCGCCA TTGTCACCGC CGCGGGTTAT CCGGGCGAGC CGACCAAGTT TGAGGGGCGA 
CTGAAGGGTT TGGTGGACGC TTTCGAGGCG CAAGCGCTGC CGAAAGAAGT GTACGAAAAG 
TTTCACGTCA TGGGTGGCGA ATGTAACTAC CTCTTGCGAG TTAACGACGA GTATCGCCTG 
GAGTTTGTAC CCTCGGAGGA GTGGCACAGC GAGCACATGT ACGACTGGAG AGACAACGAC 
GATGTTCGCA TGTTCCTCGA CCGCGCGGAA GAATTCTTGA CCTCATATGC GAAGCACTTG 
GGCGTTCAAG TGGATGTCTT GCGCAAGGAA TACGCGGTCG GAGTCTTGCC CAAGGGCGAT 
ACCATTTACG AAAACTTGGA AGAAATGGCG CTCGCGAGCC AAGCCGAGCT TAGCGACGCG 
AAGATTCCAT TCTGCGCCTT CAACGGAGGT AACGACGTTT TCGTGGACGT AGGTAACAAG 
CACATCGGTT TGCAAGCGCT CATGAAGTAC TTAAACGTCG CTGGTTCGCA AACTTTGCAC 
GTCGGCGATC GTTTCACTCT CACGGGTAAC GACGCCAAGG TGCGCGAAGC GGCGTCCATT 
CTCTGGGTCG CGAGTCCGGA CGAAACC

Protein sequence

EVFTKVETWI DEVLELPKEK RRFSKLSRMV PAVGFFFHRL PLLKALREYD EFSSLSKRRY 
VLPNFAEVRH ILNIAQVHAS SKDVRLVTFD ADGTLYADGE HFEDDNKMID KIMQLMELGI 
HVAIVTAAGY PGEPTKFEGR LKGLVDAFEA QALPKEVYEK FHVMGGECNY LLRVNDEYRL 
EFVPSEEWHS EHMYDWRDND DVRMFLDRAE EFLTSYAKHL GVQVDVLRKE YAVGVLPKGD 
TIYENLEEMA LASQAELSDA KIPFCAFNGG NDVFVDVGNK HIGLQALMKY LNVAGSQTLH 
VGDRFTLTGN DAKVREAASI LWVASPDET