Gene OSTLU_3884 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_3884
Symbol
ID	5006405
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009372
Strand	+
Start bp	118503
End bp	119561
Gene Length	1059 bp
Protein Length	353 aa
Translation table
GC content	51%
IMG OID	640421826
Product	predicted protein
Protein accession	XP_001422305
Protein GI	145356159
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1004] Predicted UDP-glucose 6-dehydrogenase
TIGRFAM ID	[TIGR03026] nucleotide sugar dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.0376581
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CGCGCTGGCT TCATCGGTAT GGGTCGTCTG GGATTGTGTA CCGCCCTCAA GTTTGAGCAA 
GCGGGTTGGG ATGTCTGTGG GTCTGACGTC TTTCCGTCGT ACGTTGAAAG TATCAACGAC 
AAGAGTCTTC GAAGCAAAGA GCCCGGAGTC GAAGAGGCTT TGCGAAAGAG CACGCGTTTG 
CGAGCGACTC TGAATCTCCT TGATGTCCTA GAGCATGCCG ATATCGTTTT CATTCTCGTC 
GCGACTCCAA CCAGCGCGGG CGAAGAGGCC TACGACACGA CAACTCTGAG CAGGGTCTTG 
AGTGATATCG CTAAATTAAG GCCGACAAAC AAACACATCG TGATTTGCTG CACAGTGTTG 
CCTGGTTACA TCTCGAACAT CGGTAGTTAC CTTATCGAAA GTTGCACTGG ATGTAGTTTG 
AGTTACAATC CAGAGTTCAT CGCCCAGGGT GAGATCATGA AGGGCCTCAG TGAACCCGAC 
GTGGTGCTCA TAGGGGAAGG AAGCGAAGAA GCCGGTGATA TTCTACAGTT TTTATACGAG 
ACCGCGACGT CCAATGAGCC TCGGATCTGT CGCATGTCTC CGCAAAGCGC TGAGATAATG 
AAACTAAGCG TAAACTGCTT TGTTACCACG AAGATCAGCT TCGCCAATAT GATTGGTGAC 
ATTGCTGACG CGACGCCTGG TGCAGACAAA TTCGACATCC TTAGAGCCGT TGGTCAGGAT 
ACACGTGTCG GCCACCGGTG CATCCTTCCA GGTTACGGCT TCGGAGGTCC TTGCTTTCCA 
CGTGATAATA GAGCACTCGG AATGTACGCA CGCAAGGTTG GAATCACTCC TTCAATTTGC 
GACGCGACGG ATGAATACAA CCGACTTCAC GCGGACGCCA TGGTAAAGGC TCTTTTGGAA 
CAAAAACTAG AGCATTATAC CATCAGTGAT GTTGCTTACA AGCCACAGTG TCCGGTGGAT 
ATTATTGAAG AGTCGCAACC ACTCGAAGTG GCCAAGAGAC TTGTTCAAGC AGGCAAGCGA 
GTCGTTATAC GCGATCGACC CGCCATCATC GAGCTCGTA

Protein sequence

RAGFIGMGRL GLCTALKFEQ AGWDVCGSDV FPSYVESIND KSLRSKEPGV EEALRKSTRL 
RATLNLLDVL EHADIVFILV ATPTSAGEEA YDTTTLSRVL SDIAKLRPTN KHIVICCTVL 
PGYISNIGSY LIESCTGCSL SYNPEFIAQG EIMKGLSEPD VVLIGEGSEE AGDILQFLYE 
TATSNEPRIC RMSPQSAEIM KLSVNCFVTT KISFANMIGD IADATPGADK FDILRAVGQD 
TRVGHRCILP GYGFGGPCFP RDNRALGMYA RKVGITPSIC DATDEYNRLH ADAMVKALLE 
QKLEHYTISD VAYKPQCPVD IIEESQPLEV AKRLVQAGKR VVIRDRPAII ELV