Gene Mchl_3044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_3044
Symbol
ID	7118322
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	-
Start bp	3214564
End bp	3215898
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	71%
IMG OID	643525795
Product	2C-methyl-D-erythritol 2,4-cyclodiphosphate synthase
Protein accession	YP_002421810
Protein GI	218530994
COG category	[I] Lipid transport and metabolism
COG ID	[COG0245] 2C-methyl-D-erythritol 2,4-cyclodiphosphate synthase [COG1211] 4-diphosphocytidyl-2-methyl-D-erithritol synthase
TIGRFAM ID	[TIGR00151] 2C-methyl-D-erythritol 2,4-cyclodiphosphate synthase [TIGR00453] 2-C-methyl-D-erythritol 4-phosphate cytidylyltransferase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.67327
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGACC AAGCCGCGCG GCCGCCCGGA CAGGAGCCGG GAAATAAATC GGTGGCGGCG 
GTCGTGGTCG CGGCCGGCAA GGGGCTGCGC GTCGGCGGCG ACTTACCCAA GCAATATCGC 
CGCGTCGGCG GCCGGGCCGT GCTGACGCGG ACGCTTGCGG CGCTGGCGCA ATCGCCCCGC 
ATCACCCGCA TCCAGCCGGT GATCGCGCCG GATGCGCAGG ACTTCTATCG CGAATGCCTC 
GCCGATCTCG ACCCGGCCCA TCGTGAAAAG CTCGCCGAGC CGGTGCCGGG CGGGGCGACG 
CGCCAGCAAT CGGTGGCGGC CGGGCTCAAA GGGCTTGCCC GCTCGGGCGC GCCCGATCTC 
GTGCTCGTCC ACGACGCGGC GCGGCCCTTC GTGGACGAGG CGCTGATCGC CCGCGCGGTC 
GCGGCAGGCT CCGAGCACGG CGCATCGGTG CCGGGCATCA CGGTCTCCGA CACGATCAAG 
CTCGTGGAGG AGATCGCGCC GGGCATCGGC CGCGTCCACG AAACTCCGGC TCGCGAAAAT 
CTCCGCGCGG TGCAGACGCC GCAGAGCTTC CGTTTCGGCC TGCTTCTCGA CGCGCATCGC 
CGGGCGGTGG CCGAGGGCCG CGACGGCTTC ACCGATGACG GGGCGCTCGC CGAATGGGCC 
GGGCTGCCGG TCGTGGTGTT CGAGGGCGAC GCACGCAACC GCAAGATCAC CCAGGCCGCG 
GACCTGATCG AGGCCGACCG GGCATTCTCC GGACGGGCTT TCTCTGAACC TGCGCCCGCG 
ATATCGGATG ACACCATGAC CACTTACGTA ACCCGCCTTG GCACCGGCTT CGACGTCCAC 
GCCTTCACGG AGGGCGACCA TGTCTGGCTC GGCGGCGTGA AAATCCCCGC CGACCGCGGC 
GTGCTCGCCC ATTCCGACGG CGACGTGGCG CTGCACGCCC TCACCGACGC GCTGCTCGGC 
GCCATCGCCG ACGGCGATAT CGGCACGCAC TTCCCGCCCT CGGACGAAAA GTGGCGCGGC 
GCGGCCTCCG ACCAGTTCCT GGCACACGCC TGCGAATTGG TGCGGGCGCG CGGCGGCAAG 
ATCGACCATC TCGACATCAC GGTGCTGGCG GAAGCTCCGC GCATCGGTCA GCACCGCGAG 
GCGATCCGCG CGCGCATCGC CGAGATCGCG GGCGTGCCGC TCTCCTCGGT GTCGATCAAG 
GCGACCACGA CCGAGAAGCT CGGCTTCGTC GGCCGCGCCG AGGGCCTCGC CGCCCAGGCC 
GCCGCGACGG TGCGCCTGCC GGAGGTTTGC GCGGAGCTGG AGACCGAGGC GGAGACCAAC 
GAGCGCCGTT CGTGA

Protein sequence

MSDQAARPPG QEPGNKSVAA VVVAAGKGLR VGGDLPKQYR RVGGRAVLTR TLAALAQSPR 
ITRIQPVIAP DAQDFYRECL ADLDPAHREK LAEPVPGGAT RQQSVAAGLK GLARSGAPDL 
VLVHDAARPF VDEALIARAV AAGSEHGASV PGITVSDTIK LVEEIAPGIG RVHETPAREN 
LRAVQTPQSF RFGLLLDAHR RAVAEGRDGF TDDGALAEWA GLPVVVFEGD ARNRKITQAA 
DLIEADRAFS GRAFSEPAPA ISDDTMTTYV TRLGTGFDVH AFTEGDHVWL GGVKIPADRG 
VLAHSDGDVA LHALTDALLG AIADGDIGTH FPPSDEKWRG AASDQFLAHA CELVRARGGK 
IDHLDITVLA EAPRIGQHRE AIRARIAEIA GVPLSSVSIK ATTTEKLGFV GRAEGLAAQA 
AATVRLPEVC AELETEAETN ERRS