Gene OSTLU_4642 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_4642
Symbol
ID	5003657
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009363
Strand	+
Start bp	265504
End bp	266544
Gene Length	1041 bp
Protein Length	347 aa
Translation table
GC content	61%
IMG OID	640419078
Product	predicted protein
Protein accession	XP_001419540
Protein GI	145350279
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1087] UDP-glucose 4-epimerase
TIGRFAM ID	[TIGR01179] UDP-glucose-4-epimerase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.609905
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.210663
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GCGTTCGCGT TCGCGAGCGA TCGCAAGGCG CACGCGCTGG TGACGGGCGG CGCGGGATTC 
ATCGGGTCGC ACTGCGCCGA GGCGCTGCTG CGGCGCGGCT ACGCGGTGAC GACGGTGGAT 
AACATGAGCC GAGGGAACGC GGGCGCGGTC GAGGCGCTGC GAAGGATGGC GCCGAAGGGA 
AGCCTGCGAG CGGTGCGAGG GGATCTGGGC GTCGTCGAGG ACGTGGACGC GGCGTTCGGG 
AACACGAACA TGCCGGTGGA CGCGGTGTTT CACTTCGCGG CCATCGCGTA CGTGGGGGAG 
TCGATGGCGG ATCCGGTGAG GTATTACTCG AACATCACGA CGAACACGGT GAATTTATTG 
CGAGTGATGC AGGCGAAAGA TGTGAGGAAG ATGATTTACA GCTCGACGTG CGCGACGTAC 
GGGAACGTGG AGAAGTTGCC CATCACCGAG TCGACGCCGA CGAGGCCGAT TAATCCGTAC 
GGCAAGTCCA AGTTGTACGC CGAAAACGCG ATCAAGGATT ACGCGCTGGC GAATCCAAAG 
TTTAAGGCGT CGATTTTGCG GTATTTCAAC GTGTTCGGGG GCGATCCCGA GGGCGTGTTG 
GGCGAGTTGC CGCGCGCGGA GTTGCGCGAG CACGGGAGAA TTTCCGGCGC GTGCTTCGAC 
GCGGCGATGA AGAACATCGA CAAGCTCACG GTGATGGGGA CGAAGCACCC GACGCGGGAC 
GGGACGACGA TACGAGACTT TGTGCACGTC GTAGATTTAG TGGACGCGCA CATAGCGGTG 
GCGGAAAAGA ACAAATTTGA TAATCCTCCG TCGTTGTACA ACGTCGGCAC GGGGAGCGGC 
GTGAGCATGC GAGAGTTCGT GGAGACGTGT AAAAAGGTGA CGGGCGTCGA CATAGAGATT 
CACTATCGCG CTGAACCTCG GCCCGGAGAT TACGCCGAGG TGTACGCGAA CGTGGACAAG 
ATCAAACACG AGCTCGGGTG GGAGGCAAAG TACACGGATT TGCACGAGAG CCTGACGCAC 
GCGTGGAAGT TTAGAAAAAC G

Protein sequence

AFAFASDRKA HALVTGGAGF IGSHCAEALL RRGYAVTTVD NMSRGNAGAV EALRRMAPKG 
SLRAVRGDLG VVEDVDAAFG NTNMPVDAVF HFAAIAYVGE SMADPVRYYS NITTNTVNLL 
RVMQAKDVRK MIYSSTCATY GNVEKLPITE STPTRPINPY GKSKLYAENA IKDYALANPK 
FKASILRYFN VFGGDPEGVL GELPRAELRE HGRISGACFD AAMKNIDKLT VMGTKHPTRD 
GTTIRDFVHV VDLVDAHIAV AEKNKFDNPP SLYNVGTGSG VSMREFVETC KKVTGVDIEI 
HYRAEPRPGD YAEVYANVDK IKHELGWEAK YTDLHESLTH AWKFRKT