Gene OSTLU_43573 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_43573
Symbol
ID	5006804
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009374
Strand	-
Start bp	431289
End bp	432299
Gene Length	1011 bp
Protein Length	317 aa
Translation table
GC content	69%
IMG OID	640422225
Product	predicted protein
Protein accession	XP_001422747
Protein GI	145357073
COG category	[R] General function prediction only
COG ID	[COG1075] Predicted acetyltransferases and hydrolases with the alpha/beta hydrolase fold
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.021277
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.157886
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTCGC GGCTCGCGCG GACGCGCGTT AAAAATACGC CGCGTCGATG GCGCGCGTCG 
TCGGCGGCGC GCGCGGCGAC GCGCGGGCGC GGACGACGCG CGACGTCGTT CGCGCCGCTC 
GAAATATCTG CAGCTTCGCG CGGCGCGGCG CGAGCGGCGC GCGGCGCGGC GCGAGCGGCG 
CGCGCGCGCG GGCGTCGGGT CGTCGTCGTG CCGGGATTTT TGACCGGGAG CGACGCGTAC 
GAGGGCGTCG CGCGCGCGCT GGCGCGAGCG ATCGGGGACG ACGCGCGCGT GCGCGTCGCG 
CCGGTGAAGC GAGAGATGTG GTTCGGGACG CTGCGCGGCG GTTCGTTCGA GGAGATTTTA 
GACGTCGTCG ACGCGTGCGC GCGAGAGGCG GCGAGGGATG GCGGTGAGAG GGTGTGCTTG 
GTCGGACACA GCGCGGGAGG GTGGTTGGGG CGGTTGTATT TGGGCGACGC GCGGGCGTAT 
CGCGGCGAAG CGCCGTACGA CGGCGCGCGA TTCGTGGACG CGTTGATCAC GCTCGGCGCG 
CCGCACGGGA GCTTGGAGAA GTATCCGTTC GGTCGCGTGA GAGAGAATAG ACCGGGGGAG 
AGCGAGTCGA TGCCGGACGA CGCGCGAGGG TCGTCGCTCG CGTTTACGAA TTATTATTAT 
CCGGGCGCGT ATCGCGCCGA CGTGCGATAC GTCGACGTCG TCGGTGATTA CGCCCGCGGC 
TCGGCGAATT TCGAGCTCTT TGACGCGCTG TGCGATAGGA GTGACACCAA GCGACCGCTC 
GTCGATCGCG TGCGCGCCGC TTGGGAAGCG TTCACGATCG GAGTTTCGTA CGCCGCCAAC 
TGCGGAAGAG CCGACGTCCG CGGCGACGGC GTCACCCCGA TCGACACCGC CCACGCCCTG 
ACGGGCTCTG AACACGTCAT CTTGCCCGGC GTGTACCACG GCCCGACGAA ACCGACTCGT 
TGGTACGGCG CCGATTCCGT CGTTGAACTG TGGTATCCGT ACTGTTTGTA A

Protein sequence

MASRLARTRV KNTPRRWRAS SAARAATRGR GRRATSFAPL EISAASRGAA RAARGAARAA 
RARGRRVVVV PGFLTGSDAY EGVARALARA IGDDARVRVA PVKREMWFGT LRGGSFEEIL 
DVVDACAREA ARDGGERVCL VGHSAGGWLG RLYLGDARAY RGEAPYDGAR FVDALITLGA 
PHGSLEKYPF GSSLAFTNYY YPGAYRADVR YVDVVGDYAR GSANFELFDA LCDRSDTKRP 
LVDRVRAAWE AFTIGVSYAA NCGRADVRGD GVTPIDTAHA LTGSEHVILP GVYHGPTKPT 
RWYGADSVVE LWYPYCL