Gene OSTLU_24843 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	OSTLU_24843
Symbol	CMS
ID	5002890
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ostreococcus lucimarinus CCE9901
Kingdom	Eukaryota
Replicon accession	NC_009361
Strand	+
Start bp	586545
End bp	587416
Gene Length	872 bp
Protein Length	275 aa
Translation table
GC content	64%
IMG OID	640418311
Product	2-C-methyl-D-erythritol 4-phosphate cytidylyltransferase (4-diphosphocytidyl-2C-methyl-D-erythritol synthase) (MEP cytidylyltransferase) (MCT) (ISPD)
Protein accession	XP_001418750
Protein GI	145348632
COG category	[I] Lipid transport and metabolism
COG ID	[COG1211] 4-diphosphocytidyl-2-methyl-D-erithritol synthase
TIGRFAM ID	[TIGR00453] 2-C-methyl-D-erythritol 4-phosphate cytidylyltransferase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	0.56499
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0645065
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CTCGCCGAGC GCGCGCGCGC ACGCCTCGCG ACCATGCTCT CGCGAAGAGC GACCGTGATC 
GCGCCCGCGC GCGCGGCGCC CGAGAGCGCG CGACGCGTCG CGCGGACGCG CGCGCGGCGC 
GGCGCGAACG TCCGAACGCG CGCGGCGAGC GAGGTCACGC AGGACGTCGC CGACGGCGCC 
GTGTCCTTCG TCCTGCTCGC GGGCGGCGTG GGCAAGCGCA TGGGAGCGGA CATGCCGAAG 
CAGTACCTGC CGCTCATGGG CACGCCGATC GCGCTGTGGT CGCTTCGGAA GTTTGCGAAG 
ATGGCTGAGG TCGGGGAGAT CGTCGTCGTG TGCGACCCGA GCTACGACGA CGTGTTTCAG 
AGCGAAGCGA TCGATAAGCC GCTGGTGTTC GCGAGACCGG GGAAAGAGCG ACAAGATAGT 
GTGTATAATG GCATGCAAGC GGCGCGGGCG GGGGCGGAGT TGTTGGCGAT TCACGATAGC 
GCGCGACCGC TGTGCGCGGC GACGGATGCG AGGCGGTGCT TCAACGACGC GAAAAAGTAC 
GGTGCGGCGG TTTTGGCGGT GCAGAGTAAG GCGACGATTA AGGAAGTGAA TAAGGATTTG 
AGCATCGATA AGGGGCTCGA TCGCAGTCGG CTTTGGGAGA TGCAAACGCC GCAAGTGATG 
CGACCCGAGT TGTTGCGAGC GGGATACGAT CTCGTGAATA GTAAGGGACT TGAGGTGACG 
GACGATGTAT CCATCGTCGA AGCCTTAGGT GAGCGCGTGC AAGTGACGCC GGGGAGTTAT 
TTCAACTTGA AGGTCACGAC GCCGGAGGAC ATGTTCATCG CGGAACGGCT GATGACGGAG 
CAGGGCGACG CCGTCGCATA AATAATTCTA AT

Protein sequence

MLSRRATVIA PARAAPESAR RVARTRARRG ANVRTRAASE VTQDVADGAV SFVLLAGGVG 
KRMGADMPKQ YLPLMGTPIA LWSLRKFAKM AEVGEIVVVC DPSYDDVFQS EAIDKPLVFA 
RPGKERQDSV YNGMQAARAG AELLAIHDSA RPLCAATDAR RCFNDAKKYG AAVLAVQSKA 
TIKEVNKDLS IDKGLDRSRL WEMQTPQVMR PELLRAGYDL VNSKGLEVTD DVSIVEALGE 
RVQVTPGSYF NLKVTTPEDM FIAERLMTEQ GDAVA