Gene OSTLU_33438 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_33438
Symbol
ID	5003741
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009363
Strand	-
Start bp	202773
End bp	203870
Gene Length	1098 bp
Protein Length	365 aa
Translation table
GC content	64%
IMG OID	640419162
Product	predicted protein
Protein accession	XP_001419740
Protein GI	145350705
COG category	[R] General function prediction only
COG ID	[COG1075] Predicted acetyltransferases and hydrolases with the alpha/beta hydrolase fold
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.163153
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGCAGA TGTCGAACGC GCTCGCGAGC ACGGCGGCGA GTCGAGGCGA CGTCGGATGG 
TTGGACGACG AGGCGGCGGA AACGACGATC GACGGCGAAT CGGCGTTCGA GGAAGCTTTG 
GAAGGAGTTT TAGCGCGTCC TGGGAGCGTG CTCGCGACGG GTGCGGAGTA CTTTTATCTG 
CTCGTGCCAG GTTTGTTTGG ATCGTACTAT CCGCGATACT ACGCCGACGT TGAGCAGGCG 
TTCCGAGACC GCGGAGCGCA GTGTCGCATC TCGCGTTTGG TCGATGGCGA AGGCGCGGTC 
GTAACGAACG CAAAGGCACT GGCGCGCGAG ATTGAAGATA TTCACGCCGA GACTGGGAAA 
CGTGTCGTGA TCATTGGACA CTCGAAGGGC GGCGTCGACG GAGGCGCGGC GCTCGCGTTG 
CACGACGACA GACTACGAAA GCTCGTGCGC GGTTTAATCG CGGTGCAAAG CCCGTTCGGA 
GGGTCACCCA TCGCGACCGA TTTACTCAGC GCGCCGTTGG CGGACCCCGT CGCTTCGCTT 
CTTGAAATTT TGGTGAGCGC GCCCAAAGGC GACGGCGCTC GATTGCTCGA GCCTATTCGC 
GACTTGACGT ATCGCGAACG TCGCGCTTTT CTCGCCGCGC ACCCCATTCC GAGTCACTAT 
CCCGTGGTGT CCTTCGCCAC GGCGACGAAA TCCGCCGCGG CCGGTTTGTT TCCATCCGCG 
CGCTACATCG ACAATCGCTA CGGCGAGCCC AGCGACGGCT TGGTGTGCGT TCGCGACGCT 
CAAATCCCTC GCGCCGTGTG CGTCAACGTC AAATTTGAAA ACGACCACGC CGACTGCGTG 
TTCCCTTCGC GGCACCCCTC CGACATGGTG GACGCGCACG CGCGCGCGCA GGCTGAAAAT 
CTCGCCCTGC GCCAGCGTCT GGGTCTGTGC GATTCCCCTC GCCGTGGTCC GCCGCTCCCG 
CCGCCCGTCG GCGTCTCCGT CGTCGCCGCG CAGCGCGCGC TCGCCGACGC CCTCCCCGAG 
CGCTTAAAGT CCTCCCCCGC GAGCGTCGAT TACCACGAAG CCTTGGTCGG GGTGTTACTC 
GCGCGTCCGG GTCCTTAG

Protein sequence

MRQMSNALAS TAASRGDVGW LDDEAAETTI DGESAFEEAL EGVLARPGSV LATGAEYFYL 
LVPGLFGSYY PRYYADVEQA FRDRGAQCRI SRLVDGEGAV VTNAKALARE IEDIHAETGK 
RVVIIGHSKG GVDGGAALAL HDDRLRKLVR GLIAVQSPFG GSPIATDLLS APLADPVASL 
LEILVSAPKG DGARLLEPIR DLTYRERRAF LAAHPIPSHY PVVSFATATK SAAAGLFPSA 
RYIDNRYGEP SDGLVCVRDA QIPRAVCVNV KFENDHADCV FPSRHPSDMV DAHARAQAEN 
LALRQRLGLC DSPRRGPPLP PPVGVSVVAA QRALADALPE RLKSSPASVD YHEALVGVLL 
ARPGP