Gene OSTLU_43341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_43341
Symbol
ID	5005369
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009368
Strand	+
Start bp	302958
End bp	303959
Gene Length	1002 bp
Protein Length	333 aa
Translation table
GC content	62%
IMG OID	640420790
Product	predicted protein
Protein accession	XP_001421256
Protein GI	145353942
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0269246
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTCGCGGCGC GCGCGAGCGG AGAGAAGAAG TCGGTGTTGA TCGTGAACAC GAATGGTGGC 
GGACACGCGA ACATCGGGTT CTGGCTGGCG AAGACGCTGG CGGGGGCTGG GCACGACGTG 
ACGATGAACG TCGTCGGCGC CGAGGACGAT AAGAAGATGG CCAAGACTCC GTTCTCGTTG 
TTCGATGAGA TTCGAGGGAT GGGTGTGAAG ACGGTGTGGG CGAACCCCGA TGAAGTGGCG 
TCCAAGCATG CCGGGGCGAA GTTCGACGTG GTCGTCGATA ACAACGGTAA GGACATGGAC 
ACCGTTGGTC CGGTGGCGGA TTTCGCCGTC GCCGCGGGGG CGTCGCAGTT CTTGTTCGTC 
TCGAGCGCGG GTATCTACAA GCCCACGCCG TGCCCGCCGC ACGTCGAGGG CGATGCCGTG 
AAGGAGACGA GCGGCCACGC CGTCGTCGAG GCGCACTTGA AGACGTTGCC GTTGAAGATG 
AGCTCTTTCC GCCCGCAATA CTTGACGGGA TACGGATCGA ACAAGGACTG CGAGGAGTGG 
TTCTTCGATC GCGCCGTGCG CGGCCGACCG ATCTTGGTCC CGGGCTCGGG TGATCAGCTC 
TCGTCGGTGA CGCACGCCGA AGATTTGGCC ACCATGATCG CCGCCGCCGT CGGCAACGAC 
GCCGCCGCTG GGGAAATCTT CAACTGCGTG ACGACGAAAG CCGTCACGCT GAACGGCATG 
GCGGAACTTT GCGCCAAGGC TGCGGGCGTC GAACCGAACG TGATCAACTA CGACCCGAAG 
GATGTCCCGG ATGTCGAAGT TAAGAAGGCG TTCCCGTTCC GCCCGATCCA CTTCTACAGC 
TCCAGCGCCA AGGCGCAAGC CGTGCTCGGC TGGTCGCCCA AGCACCCGGA TTTGGCCGCC 
GAGCTCAAGG AACGCTTCGC GTACTACAAG TCCATCGGAC GCGATAAGAA GGAGATGTCG 
TTCGAAACCG ACGACAAAAT TCTCGCCGCG ATCGGCAAGT AA

Protein sequence

VAARASGEKK SVLIVNTNGG GHANIGFWLA KTLAGAGHDV TMNVVGAEDD KKMAKTPFSL 
FDEIRGMGVK TVWANPDEVA SKHAGAKFDV VVDNNGKDMD TVGPVADFAV AAGASQFLFV 
SSAGIYKPTP CPPHVEGDAV KETSGHAVVE AHLKTLPLKM SSFRPQYLTG YGSNKDCEEW 
FFDRAVRGRP ILVPGSGDQL SSVTHAEDLA TMIAAAVGND AAAGEIFNCV TTKAVTLNGM 
AELCAKAAGV EPNVINYDPK DVPDVEVKKA FPFRPIHFYS SSAKAQAVLG WSPKHPDLAA 
ELKERFAYYK SIGRDKKEMS FETDDKILAA IGK