Gene OSTLU_34345 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_34345
Symbol
ID	5000996
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009357
Strand	+
Start bp	546997
End bp	548073
Gene Length	1077 bp
Protein Length	358 aa
Translation table
GC content	65%
IMG OID	640416417
Product	predicted protein
Protein accession	XP_001416692
Protein GI	145344338
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0153] Galactokinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.190727
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCGCG TGTTCGTCCC GGGACGCGTG TGTCTGCTCG GCGAGCACTC GGATTGGGCC 
GGCGCGCGCG CGGCGCGCGA TGGCCCGGGA GCGTGCGTCG TCGTCGGCAC GCGCGAGGGC 
GTCAGCGCGC GGTGCGACGT CGGTGAAGGG CCGCGGTTTC GCGTGGTTGG CGCGGACGGC 
GACGCGTTCG AGTGCGATGT GAGCGTCGAT GACGCGCTCG AGCGAGAGGC TTCGAGCGGA 
GGGTACTGGT CGTACGTCGC CGGGACCGCG CTGGAGGTTT TGAGGCGATT TCCGCGGTGT 
CGCGAGCGCG GGCTCGTCGT GGAGACGCTC GAGACGACGC TGCCGACGAG GAAAGGCTTG 
AGCTCGTCGG CGTGCGTCTG CGTCCTCGTG GCGCGGTGTT TCGGCGTGGC GTACGAGTTG 
GATCTCGAGC TGAAGGATGA GATGGAGTTG GCGTATCGAG GGGAGGCGGT GCACACGCCG 
AGCAAGTGTG GAGCGATGGA TCAGGCGTGC GCGTACGGGA GCGAGCGCGT CGTGGCGCTC 
ACATTCGACG GCGAAGACGT GGACGTCAGA GCGTGCGAGG TTGACGGTGA AATACACATC 
GTCGTGTGTG ATTTGGCGGC ATCGAAGAGT ACGGTGCGGA TTTTAGCCGA TTTGCAAGGA 
GCTTTCGACC GAGGGGACGA GGCGCTGCGC TCGGCGCTCG GTGCCCGTAA TCGAGCGCTC 
GTGGCCGAAG GATTAGACGC GATCAAACGC GGCGATGCGC GGGCTTTAGG CGCGGTGTAT 
ACGCGCGCAC AGACCACATT TGACGAAGCT GCGATCCACA TCTGCCCATC CGAGCTCACG 
GCGCCTCGTT TGCGCGAGAC GCTCGCCGCC GTCGCCCACG ACGTTCCGGA AACTGTCTTT 
GGCGCGAAAG GCGTCGGAAG CCAAGGCGAC GGTGCCGCGC AATTCGTGGC GGTATCTGAA 
GCAGCGGCTA AAACACTCCG ACAGTACTTG CACGACTTTT CGGGCGGTCG GTTTAAAGTA 
TTCGACGTCG TTCTGCGAGA CGAAGAGCGC CACGCACGAA CTAGCACACA CAAATAG

Protein sequence

MPRVFVPGRV CLLGEHSDWA GARAARDGPG ACVVVGTREG VSARCDVGEG PRFRVVGADG 
DAFECDVSVD DALEREASSG GYWSYVAGTA LEVLRRFPRC RERGLVVETL ETTLPTRKGL 
SSSACVCVLV ARCFGVAYEL DLELKDEMEL AYRGEAVHTP SKCGAMDQAC AYGSERVVAL 
TFDGEDVDVR ACEVDGEIHI VVCDLAASKS TVRILADLQG AFDRGDEALR SALGARNRAL 
VAEGLDAIKR GDARALGAVY TRAQTTFDEA AIHICPSELT APRLRETLAA VAHDVPETVF 
GAKGVGSQGD GAAQFVAVSE AAAKTLRQYL HDFSGGRFKV FDVVLRDEER HARTSTHK