Gene OSTLU_25086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_25086
Symbol
ID	5003861
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009363
Strand	-
Start bp	614902
End bp	616276
Gene Length	1375 bp
Protein Length	438 aa
Translation table
GC content	63%
IMG OID	640419282
Product	predicted protein
Protein accession	XP_001419856
Protein GI	145350953
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0524] Sugar kinases, ribokinase family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.300966
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.110064
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCTCGA CGCGAGTCGC CGCGCACGCG CACGTCGAGC GGCGACGCGC GTGTGGAGAG 
TGCGCGCACA GTGGTCGTGC GTCGTCCCGC GCGCGCGCGG GCGCGCGCGA GCGAGAGGTG 
CGACGAAGGG TGGCGCGGCG CGCGAGTCGA GAGTACGACG TCGTCGCGCT CGGTAACCTG 
TGCGTGGACG TGTTACTGCC GCCCGGCCCG ATCCCAGACG CGACGTCGCT GAAGACGACT 
AAAACACTCG GTGAACTCGC GAGGACGGCG CCGGCGCGAG AGTCGTGGGA ACTGGGCGGG 
AATTGTAATT TTTTAATCGC GGCGTCGAGG CTGGGCTTGC GAGCGTCGTG CGCGGGACAC 
GTCGGAAACG ATGAATACGG CAAGTTTTTG ATCGATGAGC TCGCGCTGGA GGGAATTGAT 
CACGTGGAAT TGATTCCAGG AGACGATCAG GGCGTGCGCG TGAGCGCTTT GGCCGAGACG 
TTGATTTGTT TCGTGTTGAG CGACGGCGCC GGTTCGCACG CGTTTTGTAG TAGGTACGAT 
TTGGGCCCGT GGCCGCTGAT GCGGGACGTG AGCGACGTCT CTAACGAAGC GCGCGAGGCG 
TTGCGTTCGT GTCGAGCGGT GTTTCTCAAC GGTTTTGTGT TCGACGAGCT CAAGCCTCAG 
GCTGTAGCGC AGGCGCTCAA ATTGGCCAAG GGGAACGGCG CGGGGGTGTT TTTCGATCCG 
GGGCCTCGCG CGTTTACGTT TGTCGACGAG ACGAATCCGT CACGCATGGA GGCATTGAGA 
GTGGCGCTGG AAAATTCCGA CGTCGTGCTC GCGACCGAGG AAGAACTCGC AGCGCTCACG 
GGCGTGCGTG CGAATGCGCC GCCCACGGAC TACGCCGCGG CTGTGTTCGA CTTTCCGGGA 
TCCGCGGCGG AGTGGGTCGT CGTGAAGCTC GGTCCCGAAG GCGCGATGGT CGTCACGCGC 
GACGGTCAAA GCGCGCGCGT CGGTTGTCCA CGCGTGAAAG TCGGCGACAC CGTGGGGTGC 
GGTGATAGCA GCGCGGGCGC GTACGTCTTA GGATACCTGC GAAAGCAAGC CGACGACGCG 
TTGGATTTGA GCGAAGTCTT GCAAACCACC GCGACGCTCG CGACGCACGT GGGAAGCGCC 
ACGGCGATGA ACATCGGCGC CGGTCGAAAC GTCGCGAAAG CAGAGACCGT GCTCGAGCTC 
TTAGACGCGG CGGTGGACGG TAAGACCGAG GGGGTCGATC GAGGCACGGC GTCGCGCGCG 
CAAGCGATTC TTCGCGAGTC GATGAACGAG TCGATGAAAC AACAACAAGC GCGATAATTA 
TTGCATCCCA ATCACTAGCG GGTTTCATAA ATACGACTAG ACATATCGTT ACGCG

Protein sequence

MISTRVAAHA HVERRRACGE CAHSGRASSR ARAGAREREV RRRVARRASR EYDVVALGNL 
CVDVLLPPGP IPDATSLKTT KTLGELARTA PARESWELGG NCNFLIAASR LGLRASCAGH 
VGNDEYGKFL IDELALEGID HVELIPGDDQ GVRVSALAET LICFVLSDGA GSHAFCSRYD 
LGPWPLMRDV SDVSNEAREA LRSCRAVFLN GFVFDELKPQ AVAQALKLAK GNGAGVFFDP 
GPRAFTFVDE TNPSRMEALR VALENSDVVL ATEEELAALT GVRANAPPTD YAAAVFDFPG 
SAAEWVVVKL GPEGAMVVTR DGQSARVGCP RVKVGDTVGC GDSSAGAYVL GYLRKQADDA 
LDLSEVLQTT ATLATHVGSA TAMNIGAGRN VAKAETVLEL LDAAVDGKTE GVDRGTASRA 
QAILRESMNE SMKQQQAR