Gene OSTLU_3043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_3043
Symbol
ID	5004548
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009365
Strand	-
Start bp	307167
End bp	308390
Gene Length	1224 bp
Protein Length	408 aa
Translation table
GC content	66%
IMG OID	640419969
Product	predicted protein
Protein accession	XP_001420472
Protein GI	145352265
COG category	[G] Carbohydrate transport and metabolism [O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG5371] Golgi nucleoside diphosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.064968
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ACACGCTACG CCGTCGTCAT CGACGCCGGC TCCACGGGCA CGCGCGTGCA CGTGTTCACG 
TTCTCTCGAT CGGCGTTCGC GAGCGGCGGC GAGGCGCTGC GAGACGAGAC GTTTCGCTCG 
ATCGAACCGG GACTGAAGAG CTACGGCGGC GACGCCGAGG CGGCGGCGAC GTCGATCGAG 
GCGCTGATCG ACGTGGCGAA AGGAGTCGTG CCGGAGAGCG CGAGACGAGA AACACCGTTT 
AGTGTGCGCG CGACGGCGGG ATTGAGACTG ATGCCCGAAG GGCGGGAGGC GGCGGACGCC 
ATCGTGGAGG CGGTGCGACG AAAAATCGCG AACGCGGGAT TTCATCCGTC GTCGGCGTCG 
TTCGTGAGCA TCATGGACGG CGAAGACGAG GGCGCGCACG CGTGGGTGAG TGTAAATTAT 
TTGCTAGGGA ATCTCGGCGG GGCGCCGGAG AAGACTGTGA CGGTGGTAGA TTTAGGCGGC 
GGGAGTACGC AAATCGCGTA CGCGGTGGGC GGGGGCGCGG CGAAGGACGC GCCGAAAGGG 
TACGTGCGCG ACATCGAGGC GGCGTCGACG ACGTATAGGA CATACGTGCA TTCGTTTAAG 
GGCTACGGTA TCGTCGCCGT ACGGCCGAAG ATATTTAGCG TGGGGAAGAA TAAAGACGGT 
TCGCATCCGT GCTTACCGAA CGCGTTCGCG GATTCGTGCG AAAAAGATTG CTACGGGCTC 
GAGCCTGGGG AGACGTACGC CGCCATCGGA TCCAGCGACG GCAGCGACTT TACACGGTGT 
CTGCTCGCCA CGACGCAGGC GCTCGAGGGA AATTGCGCGA AAGCACCGTG TTCGTTCGCC 
GGCGCTTGGA CGACGCCGCG CAAAACGCCC CTCTTCGTCA TGTCCTTCAT CGTCGAACGC 
GCGATTCAAG GCGGCGCGGT GCCGCCGCCG AGGCGCCCGA CCGATATCGC GACCATGACA 
CCGCGCGACG TGAAGCGAGC CGCCCTTCGC GCGTGCTCCA CGCCCGCCGC CGAGCTCGAG 
GCTCGCTTCC CCGTCGCCGC GCGCGACGCC GTCGACGTCA ACTACCTCTG CCTCGACCTC 
GTCTACGTGT ACGCCCTCCT CACCGTCGGT CACGGCGCCG CGGACGACGA GACGATTCGC 
GCGCTCGACA AGATTCGTTA CCGGCGTCGA GACGTCGAGG CGAGCTGGGC GTTGGGCGAC 
GGCATCGCCG CCGCCGCCGC CGCG

Protein sequence

TRYAVVIDAG STGTRVHVFT FSRSAFASGG EALRDETFRS IEPGLKSYGG DAEAAATSIE 
ALIDVAKGVV PESARRETPF SVRATAGLRL MPEGREAADA IVEAVRRKIA NAGFHPSSAS 
FVSIMDGEDE GAHAWVSVNY LLGNLGGAPE KTVTVVDLGG GSTQIAYAVG GGAAKDAPKG 
YVRDIEAAST TYRTYVHSFK GYGIVAVRPK IFSVGKNKDG SHPCLPNAFA DSCEKDCYGL 
EPGETYAAIG SSDGSDFTRC LLATTQALEG NCAKAPCSFA GAWTTPRKTP LFVMSFIVER 
AIQGGAVPPP RRPTDIATMT PRDVKRAALR ACSTPAAELE ARFPVAARDA VDVNYLCLDL 
VYVYALLTVG HGAADDETIR ALDKIRYRRR DVEASWALGD GIAAAAAA