Gene OSTLU_38341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_38341
Symbol
ID	5003942
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009364
Strand	+
Start bp	570652
End bp	571980
Gene Length	1329 bp
Protein Length	442 aa
Translation table
GC content	64%
IMG OID	640419363
Product	predicted protein
Protein accession	XP_001420039
Protein GI	145351340
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1070] Sugar (pentulose and hexulose) kinases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.300966
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.435151
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGCGCG CGCGCGCGAG CGCGAGCGAT GGGTGGTTGT ACTGCGGCTT GGACTTTGGG 
ACGTCGAGCG CGCGCCTGGC GCTCGTGGAC GATCGAGGCG CGCTCGTCGG CGTGCGAACG 
AGGGCGTACG ACGACGCGAA CGCGAGCGTC GCGCGGGCGT GGGAGCGCGC GCTGTTCGAG 
CTGCTCGAGG ACGCGATGGA CGCGGAGGAG CGCGAGCGGT GCCAAGGCGT GGCGGTGGAC 
GGCACGAGCG GGACGGTGGT CATCGTCGAC GCGCGCGACG GGCGAGCGCT GCGAGAACCG 
TACATGTATA ACGAAACGTT TCCAGACGAA GTAGAACGCG TGCGAGCGCT GAGGAACGGG 
CCGGGGAAGG ATTCGACGGA GAGCGCGTCG AGCGCGGCGT GTAAACTTTC GAGATGGTTT 
CGCGTGGACG CGGAGGGAGA CAGAGAGCAC GCGGCGCTGT TGCATCACGC GGATTGGTTG 
GCGTATCTGC TGCACAAGAA GATGGGCATG AGTGATTTCA ATAACGCGTT GAAGCTTGGG 
TTCGATCCAG CGCCGGGGGT GGAGGCGTTT CCGGGATGGT TGCGAGACGC GCCGTTTGGG 
TACATGTTGC CGACGGACGT TCGCGCGCCG GGAACGTCGT TCGGCGTCAT GGACGCCGAT 
GTGGCGAAGC GGTTAGGATT TCCGTCGACG TGTGAAGTCA TCGCAGGGAC GACGGATAGC 
GTCGCCGCGT TCGTGGCGTC GAAGGCGGCC GAATCGGGAG AGTGCGCGAC GAGTCTCGGG 
AGCACGCTCG CGTTGAAACT CATCTCCGAC ACGCGCGTCG ACGACCTGAG CTCGGGCGTG 
TACTCGCACC GTCTCAACGG TCGGTGGCTC GTGGGCGGGG CGTCGAATCT GGGAGGATGG 
ATTTTACGCA GATTCTTTTC CAACGACGCC CTCGAGTCGC TGAGCGAGAA AATAGCAAAC 
GAAGGTTACG TCGCGACGGA GGATTATTTC GACGGGGTGA TGCTAGGTTT CGGTCTGAGC 
GTCGACGAGG CGTCGGCGAT CGTGGAAAAG TCACGACCGG CGGACGACGC GCAATTCGTG 
GTGAACATTC TCAGTTCCAT CGCCAACGTC GAGGCGAGAT GCTACGAGCG CATGCGAACG 
CTCGGGGCGT CGCACGGCGC GCGCAAAGTG TACACCGCGG GAGGTGGGGC GAAGAACGGC 
GTGTGGAGTG GCATGCGCTC GAAAGCCATG GGAGATATCC CTGTCGAACG ATCGGCGTGC 
GACGAAGCCG CGTACGGCGC GGCGCTCCTC GCTCGACAGG GAAGGAAACG GTTATCCGGC 
TACATTTAA

Protein sequence

MRRARASASD GWLYCGLDFG TSSARLALVD DRGALVGVRT RAYDDANASV ARAWERALFE 
LLEDAMDAEE RERCQGVAVD GTSGTVVIVD ARDGRALREP YMYNETFPDE VERVRALRNG 
PGKDSTESAS SAACKLSRWF RVDAEGDREH AALLHHADWL AYLLHKKMGM SDFNNALKLG 
FDPAPGVEAF PGWLRDAPFG YMLPTDVRAP GTSFGVMDAD VAKRLGFPST CEVIAGTTDS 
VAAFVASKAA ESGECATSLG STLALKLISD TRVDDLSSGV YSHRLNGRWL VGGASNLGGW 
ILRRFFSNDA LESLSEKIAN EGYVATEDYF DGVMLGFGLS VDEASAIVEK SRPADDAQFV 
VNILSSIANV EARCYERMRT LGASHGARKV YTAGGGAKNG VWSGMRSKAM GDIPVERSAC 
DEAAYGAALL ARQGRKRLSG YI