Gene OSTLU_50659 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_50659
Symbol
ID	5004191
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009364
Strand	-
Start bp	580139
End bp	581271
Gene Length	1133 bp
Protein Length	347 aa
Translation table
GC content	62%
IMG OID	640419612
Product	predicted protein
Protein accession	XP_001420220
Protein GI	145351730
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0524] Sugar kinases, ribokinase family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTCGCGCGAT CGCGTCGCGA GTCGACCCGA CCCGCGCGCA CACCGGGACG CGTCGCGACG 
ATGGCGCCGC ACGCGAATTT GCGCCTGCTC GGCATGGGGA ACCCGCTGCT GGACATCTCC 
GTCGCGTGCG AGGACGACGC GCTGCTGAAA AAGTACGACT TGAAGCTGAA TGACGCGATC 
TTGGCGGAGG CGAAGCACGC GCCGCTGTAC GAGGAGATGG CGACGCACGG AGACGTGGAG 
TACATCGCGG GAGGCGCGAC GCAAAATACC ATCCGCGTCG CGCAGTGGAT GATGCAGCGA 
GAGGGCGCGA CGGCGTACAT GGGGTGCGTG GGAGAGGATA AGTTTGCGAC GCAGATGCGG 
GCGTCGTGCG AGAACGACGG GGTGCTCGCG AATTACATGG TGGACGCGTC CACGCCGACG 
GGGACGTGCG CGGTGATCGT GAAGGATGGC GAGCGATCGC TGTGCGCGGC GCTGAACGCG 
GCGAATAATT ACAAGGCGGA ACACTTGGAC GCGAGCGAAA ATTTCGCCCT CGTGGAACGC 
GCCGATTTTT ATTACATGGC TGGTTTCTTC ATGACGGTGA GCCCGGAGAG CATCATGCGC 
GTCGCCAAGC ACGCGTGCGA GAATAAGAAG ACGTTCATGA TGAACCTCAG CGCGCCGTTC 
TTGATGCAAG TGCCGCCGTT CCTGGCGACG CTCATGGAGG CGCTCCCGTA CGTGAACATC 
TTGTTCGGTA ACGAATCCGA AGCCGTCACG TTTGCCGAAT CTCAATCCTG GGACACCAAG 
GACATCAAGG AAATCGCTCT CAAGATTTCC GCCATGCCCG TGGCGGAAGG CAAGCCGTCT 
CGCACGGTTG TCATCACGCA AGGTTGCGAC CCGACCGTCG TCGCGCGCGA CGGCGCCGTC 
GAAGAGTACG CCGTCATCCC GCTCGCCAAG GAAGACTTGG TGGATACCAA CGGCGCGGGT 
GATGCTTTTG TCGGTGGCTA CATCTCGCAA CTCGTGCAAG GCGCGGACGT CGCCAAGTGC 
TGCGCCGCGG GTAACTACGC CGCGAACAAG ATCATCCAAG AGTCTGGCTG CAAGTGCCCC 
GGAGTGCCGT CTTTCACCGC GTAATCCGCC TCGACGAGAT TTGATTAGAC AGT

Protein sequence

MAPHANLRLL GMGNPLLDIS VACEDDALLK KYDLKLNDAI LAEAKHAPLY EEMATHGDVE 
YIAGGATQNT IRVAQWMMQR EGATAYMGCV GEDKFATQMR ASCENDGVLA NYMVDASTPT 
GTCAVIVKDG ERSLCAALNA ANNYKAEHLD ASENFALVER ADFYYMAGFF MTVSPESIMR 
VAKHACENKK TFMMNLSAPF LMQVPPFLAT LMEALPYVNI LFGNESEAVT FAESQSWDTK 
DIKEIALKIS AMPVAEGKPS RTVVITQGCD PTVVARDGAV EEYAVIPLAK EDLVDTNGAG 
DAFVGGYISQ LVQGADVAKC CAAGNYAANK IIQESGCKCP GVPSFTA