Gene OSTLU_31076 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_31076
Symbol
ID	5001623
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009358
Strand	-
Start bp	260326
End bp	261835
Gene Length	1510 bp
Protein Length	488 aa
Translation table
GC content	56%
IMG OID	640417044
Product	predicted protein
Protein accession	XP_001417460
Protein GI	145345947
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0153] Galactokinase
TIGRFAM ID	[TIGR00131] galactokinase

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CGCGCGCGAG ACGGCGAGCA TGGGGACGGA TGATGAGGTG CGAGTGGTGA GCTCGTTAGA 
AGAGATATAT GACGCCGCGT CGCTGGAGAC GCACACGCGC GCGCGGTACG CGACGGTGCG 
CGATGCGTTC GTGAAGGCGT ACGGACGCGA GCCGGACGCG TTCGCGAGGT CGCCGGGACG 
AGTGAATTTA ATCGGCGAAC ACATCGATTA CGAGGGGTAC TCCGTGCTGC CGATGGCGAT 
CGGGCTCGAC ACTATCGTCG CCATCTCCGT GAATGCGAGT TCGGGGAAGA TCGCGGTCGG 
GAACACGAAC GAAAAGTACA CGCCGAAGAC ATTCGAGAGC TCGCCCGAAC AAGACGTGGA 
CGCGGCGTCT TTGCACTGGA CGAATTACGT CATGTGCGGC TACAAGGGGG TGTTCGATTT 
CTTGAAAGAG AGCGATAAGG CATCACCCGC CCCCGTTGGG TTGGACATCA TCGTCGACGG 
CACGGTACCC ACTGGAAGCG GTTTGAGTTC GTCCTCGGCG TTGTGCTGCG CCGTGGCGGT 
GGCGGTGATG CACGCGCTAG GATTGAATTT CACTCAAGGT GAAATTGCTG ACTTCACGTG 
CAAGTGCGAA CGATACTCAG GAACGCAGTC GGGGGGTATG GATCAAGCTA TTTCCATCAT 
GGGCGAAGCT GGTGTGGCAA AATTGGTCGA TTTCAATCCC ATAAGCACCA ACGACGTCAA 
CCTTCCGGAG GAAGCGGCGT TCATCATAGG CAACTGCCTC GCAGTGAGCA ACAAAGCGGA 
GACCGCACAC GAGCGCTATA ATTTGCGCGT CGTAGAGTGC CGTCTTGCGG CGATTATTTT 
AGGTTTAAAG CTAGGTATGA ACGCGGAAGA AGCGTCAAAA ATAGAGACGC TCAAGGAAAT 
CGAAGACTTT GTCGGCTCCA TGTCTGCCGC TAAGGCTGCG GCCGAGGAAC ATTTGCACGA 
GGGATACTAC GATGCAAGAG AGATTGAAGA ACTCATAGGA GTAGAAGCAT TCATGGACGT 
CTTCTCTTCA CCAGCGTCGA AGTTGGTCTT GAGTCACAAC GAGAAGGGAT ATAAGCTTCT 
GGCGCGGACG TTGCACGTCT ACTCCGAGGC CGGTCGTGTG CACTTGTTCG CTGCGGCGTG 
CGCGATGAAG GTCGACCCAA CGGAGCTGGG CGTGTACATG AATGGTAGCC ACGAATCTTG 
TAGAGCCCTG TACGAGTGCT CTTGCGCGGA GCTGGATGAA CTCGTGGATG CATTTAGAGC 
GGCGGGTGCT CTGGGCGCGC GTCTTACTGG TGCTGGTTGG GGCGGTTGTG CCGTAGCAAT 
TGTCGCCAAG GATGCGGTAG AGAGTGTTCT GAAAGCGGTG CACGAGTCTT TCTACTCTTC 
TCGCATCGCT GCGGGCCTTA TTTCTGCTGA CAATATGGCG ACGACGCTCT TCGCAACGCT 
GCCCAGCTCT GGTGCGGCAA TTTTGAAAGG CGTTTCGTTC GCTTAGATCG GTATTTGATA 
CGTGCCGAAC

Protein sequence

MGTDDEVRVV SSLEEIYDAA SLETHTRARY ATVRDAFVKA YGREPDAFAR SPGRVNLIGE 
HIDYEGYSVL PMAIGLDTIV AISVNASSGK IAVGNTNEKY TPKTFESSPE QDVDAASLHW 
TNYVMCGYKG VFDFLKESDK ASPAPVGLDI IVDGTVPTGS GLSSSSALCC AVAVAVMHAL 
GLNFTQGEIA DFTCKCERYS GTQSGGMDQA ISIMGEAGVA KLVDFNPIST NDVNLPEEAA 
FIIGNCLAVS NKAETAHERY NLRVVECRLA AIILGLKLGM NAEEASKIET LKEIEDFVGS 
MSAAKAAAEE HLHEGYYDAR EIEELIGVEA FMDVFSSPAS KLVLSHNEKG YKLLARTLHV 
YSEAGRVHLF AAACAMKVDP TELGVYMNGS HESCRALYEC SCAELDELVD AFRAAGALGA 
RLTGAGWGGC AVAIVAKDAV ESVLKAVHES FYSSRIAAGL ISADNMATTL FATLPSSGAA 
ILKGVSFA