Gene OSTLU_32875 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_32875
Symbol
ID	5003458
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009362
Strand	-
Start bp	555
End bp	1823
Gene Length	1269 bp
Protein Length	370 aa
Translation table
GC content	61%
IMG OID	640418879
Product	predicted protein
Protein accession	XP_001419252
Protein GI	145349672
COG category	[C] Energy production and conversion
COG ID	[COG0039] Malate/lactate dehydrogenases
TIGRFAM ID	[TIGR01772] malate dehydrogenase, NAD-dependent

Plasmid Coverage information

Num covering plasmid clones	71
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAACG CCGTCGGTGC CGCCGCGCGT CGCGTCGGCG CGTTGCGCGC GCAAGTCGTC 
GATCCCGCCT CATCGTCGCG GCAGACGCCT CAGGAAGCGC CATCCGCGCG CGTCGGGCTC 
GTGGATTGGT TCTTCGGTGC GTCCGGGATC GGTGGTAAGC GCGCGTCGTT CACCGTCGCC 
GTCCTCGGCG CGGCGGGCGG TATCGGGCAA ACGCTCTCCG CATTCATCAA GGCGAATCCA 
AAGGTGGCGG AACTGCGACT CTACGACGTC GCGCCCGTCG TTCGAGGCGT CGCCGCGGAC 
GTCTCTCACG TGAACACGCG AGCGAAGGTG AGCGGATACG TCGGTGATGA CGAACTTGAG 
GCGTGTTTAC GAGGATGTGA CCTCGTCATC ATTCCCGCGG GCGTGCCGCG CAAACCGGGC 
ATGTCGCGCG ACGACTTGTT CGGCGTGAAC GCCGGGATCG TCCGCACACT GTGCGAGGGT 
GTGGCAAAGA CGTGCCCGAA CGCGATCGTA AATATCATAT CCAACCCCGT GAATTCAACG 
GTTCCCATCG CGGCGGAAGT GTTTAAAAAT CACGGTTGTT ACGATGCGCG CAAACTTTTG 
GGCGTGACGC ACCTCGACGT GATGCGGGCG AAGACGTTCG TCGCCGCGGC AAAAGGGTTC 
GACGACCCGA CTTTGGTGGA CGTCCCGGTG ATCGGTGGAC ACGCGGGGAC GACGATTTTG 
CCGTTACTGT CTCAAACCAC TCCGCGTTGC TCGTTTACGC CCGAGGAAGT GAGCGCGTTG 
ACGAGTCGAA TCCAAAACGG TGGCACCGAA GTCGTCGAAG CGAAGGGAGG CGCCGGAAGC 
GCCACGCTCT CCATGGCCGC TGCCGCGGCG GAGTTCGCGG ATGCGTGTCT CAGAGGATTG 
AGCGGTGAGT CTGGAATATG GGCGTGTGCG TACGTCGAGA GCAAGGCGAC GCGGGCGCCT 
TTTTTTGCCA CCAAGGTGCT CCTCGGACGA AACGGCGTGG AGCGCGTGGC GGGCACTGGA 
ACGCTATCAT CGTACGAGAA GCGCGCGTTG GAGAGCATGT TACCAGAACT GGAAGCTAGC 
ATTAAAAAGG GGATCAATTT CCTTCATTCC TAATCGACGA GCGCGACCGA CTGACCGCGA 
CCACCTTTAG AGACGGCGTC TCGTCGTCGA ATGTAAAGAA ACAATGCACG TCAAGATGCG 
AATGTGTGAC CGAACATGTA CGATCGCGCT CTAGAAAGCT AAGGAATAGG AATACGAAGC 
GATTCACCC

Protein sequence

MSNAVGAAAR RVGALRAQVV DPASSSRQTP QEAPSARVGL VDWFFGASGI GGKRASFTVA 
VLGAAGGIGQ TLSAFIKANP KVAELRLYDV APVVRGVAAD VSHVNTRAKV SGYVGDDELE 
ACLRGCDLVI IPAGVPRKPG MSRDDLFGVN AGIVRTLCEG VAKTCPNAIV NIISNPVNST 
VPIAAEVFKN HGCYDARKLL GVTHLDVMRA KTFVAAAKGF DDPTLVDVPV IGGHAGTTIL 
PLLSQTTPRC SFTPEEVSAL TSRIQNGGTE VVEAKGGAGS ATLSMAAAAA EFADACLRGL 
SGESGIWACA YVESKATRAP FFATKVLLGR NGVERVAGTG TLSSYEKRAL ESMLPELEAS 
IKKGINFLHS