Gene OSTLU_42336 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_42336
Symbol
ID	5003350
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009362
Strand	+
Start bp	148333
End bp	149625
Gene Length	1293 bp
Protein Length	430 aa
Translation table
GC content	62%
IMG OID	640418771
Product	predicted protein
Protein accession	XP_001419083
Protein GI	145349318
COG category	[C] Energy production and conversion
COG ID	[COG0039] Malate/lactate dehydrogenases
TIGRFAM ID	[TIGR01757] malate dehydrogenase, NADP-dependent [TIGR01759] malate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.22262
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.238463
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCGC GCGCGACGAC GACGACGCGC GCGCGAACGA CGACGACGAC GACGACGACG 
CGGGCGGCGA TAGGTCGACG ACGCGCGCGC GAACCGAACG CGCGACGACG CGGAGACGCG 
TGCGTGCGGT ACAACACGCC CGCGGGCGTG GGGAGGAAGG CGGACGATCC TCTGGGGGTG 
TTCAGGCTGG AGTACGACAT CTCGATGGAC GAGGCGCATC GACCGAAGAC GTGGAAGCCG 
ACGGTCACGG TGGCGGTGAG CGGCGCGGCG GGGCAGATTT CGAATCACTT GTTGTTTAAG 
ATCGCGAGTG GGTCGGTGTT CGGACACGAT CAGCCGGTGG TGTTGAGATT GCTCGGGAGC 
GAGCGGTCGA GACAGGCGCT GGAGGGGGTG GCGATGGAGC TGGAGGATTG CTTGTTTCCG 
TTGTTGCGCG AGGTCGACAT CGGCATCGAC TGCAGGAAAG TCTTCGCGGG CGCGGATTGG 
GCGCTGTTGA TCGGGGCGAA GCCGCGTGGA CCGGGGATGG AGCGCGGAGA TTTGCTTGAG 
ATGAATGGGG CGATTTTCGT CGATCAAGGC AAGGCGTTGA ACGAGGTGGC GAAGCCGACG 
TGCAAGGTCA TCGTCGTCGG GAACCCTTGC AACACGAACG CGCTCATCGC GCTGTCGCAC 
GCGCCCAACT TGGATCCGCG CAACTTCCAC GCGTTGACCA AGCTCGACGA AAACAGAGCA 
AAGTGTCAAC TCGCGCTCAA GGCGGGCGTG TTCTACGAAA CCGTGAGTAA CGTCGTCATT 
TGGGGCAACC ACTCCACGAC GCAGGTGCCG GATTTCGTCA ACGCCAAGAT CGACGGTAAG 
AAAGCCACCG AAGTCATCAC CGATCAAGAC TGGCTCGAGA ACGACTTCAC TCCCGCGATT 
CAAACCCGCG GCGGGTTGCT GATCAAAAAG TGGGGTCGCT CTTCCGCGGC GTCCACGGCG 
GTGTCCATCG CCGATCACAT CAGAAATTTG GTCAACCCGA CGCCGGAGGG CGACTGGTTC 
TCCACAGCCG TGCTCAGTAA CGGTAACCCG TACGGCATCC AAGACGGCAT CGTTTACTCC 
TTCCCGTGCC GCTCCAAGGG CGATGGTTCG TACGAAATCG TTCCCGGTTT AGAAGTGAAC 
GACTGGCTTC GCGAGCGCAT GAAGAAGAGC GAAGAAGAGC TCACCAGCGA AAAGGGCTGC 
GTCGGCCACC TCGTCGGGGA AGCGCACGTT GACGTCCCAG ACGCAGGGTG CCCGGTCGAT 
CTCGAAGACA CTCTTTTGCC AGGTGAAATG TAA

Protein sequence

MTARATTTTR ARTTTTTTTT RAAIGRRRAR EPNARRRGDA CVRYNTPAGV GRKADDPLGV 
FRLEYDISMD EAHRPKTWKP TVTVAVSGAA GQISNHLLFK IASGSVFGHD QPVVLRLLGS 
ERSRQALEGV AMELEDCLFP LLREVDIGID CRKVFAGADW ALLIGAKPRG PGMERGDLLE 
MNGAIFVDQG KALNEVAKPT CKVIVVGNPC NTNALIALSH APNLDPRNFH ALTKLDENRA 
KCQLALKAGV FYETVSNVVI WGNHSTTQVP DFVNAKIDGK KATEVITDQD WLENDFTPAI 
QTRGGLLIKK WGRSSAASTA VSIADHIRNL VNPTPEGDWF STAVLSNGNP YGIQDGIVYS 
FPCRSKGDGS YEIVPGLEVN DWLRERMKKS EEELTSEKGC VGHLVGEAHV DVPDAGCPVD 
LEDTLLPGEM