Gene Mext_2817 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_2817
Symbol
ID	5831920
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	3155069
End bp	3156403
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	72%
IMG OID	641368618
Product	2C-methyl-D-erythritol 2,4-cyclodiphosphate synthase
Protein accession	YP_001640278
Protein GI	163852235
COG category	[I] Lipid transport and metabolism
COG ID	[COG0245] 2C-methyl-D-erythritol 2,4-cyclodiphosphate synthase [COG1211] 4-diphosphocytidyl-2-methyl-D-erithritol synthase
TIGRFAM ID	[TIGR00151] 2C-methyl-D-erythritol 2,4-cyclodiphosphate synthase [TIGR00453] 2-C-methyl-D-erythritol 4-phosphate cytidylyltransferase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.288222
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.315391
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGACC AAGCCGCGCG GCCGCCCGGG CAGGAGCCGG GGAATAAATC GGCGGCGGCG 
GTCGTGGTCG CGGCCGGCAA GGGGCTGCGT GTCGGCGGCG ACTTACCCAA GCAATACCGC 
CGCGTCGGCG GCCGGGCCGT CCTGACGCGG ACGCTTGCGG CGCTGGCGCA ATCGCCCCGC 
ATCACCCGCA TCCAGCCGGT GATCGCGCCG GATGCGCAGG ACTTCTATCG CGAATGCCTC 
GCCGATCTCG CGCCTGCCCA TCGTGAAAAG CTCGCCGAGC CGGTGCCGGG CGGGGCGACG 
CGCCAGCAAT CGGTGGCGGC CGGGCTCGAA GGGCTCGCCC GCTTAGGCGC GCCCGATCTC 
GTGCTCGTCC ACGACGCGGC GCGGCCCTTC GTGGACGAGG CGCTGATCGC CCGCGCGATC 
GCGGCCGGCT CCGAGCACGG CGCATCGGTG CCGGGCATCG CGGTCTCCGA CACGATCAAG 
CTCGTGGAGG AGATCGCGCC GGGCATCGGC CGCGTCCACG AGACCCCGGC GCGTGAAAAT 
CTCCGCGCGG TGCAGACGCC GCAGAGCTTC CGTTTCGGCC TGCTTCTCGA CGCGCATCGC 
CGAGCCGTCG CCGAGGGCCG CGACGGCTTC ACCGATGACG GGGCGCTCGC TGAATGGGCC 
GGGCTGCCGG TCGTGGTGTT CGAGGGCGAC GCCCGCAACC GCAAGATCAC TCAGGCTGCC 
GACCTGATCG AGGCCGACCG GGCATTCTCC GGACGGGCTT TCTCTGAACC TGCGGCCGCG 
ATATCGGATG ACACCATGAC CACTTACGTA ACCCGCCTCG GCACCGGCTT CGACGTCCAC 
GCCTTCACGG AGGGCGACCA TGTCTGGCTC GGCGGCGTGA AGATCCCCGC CGACCGCGGC 
GTGCTCGCCC ATTCCGACGG CGACGTGGCG CTGCACGCCC TCACCGACGC GCTGCTCGGC 
GCCATCGCCG ACGGCGACAT CGGCACGCAC TTCCCGCCCT CGGACGAGAA GTGGCGCGGC 
GCGGCCTCCG ATCAGTTCCT GGCCCATGCC TGCGAATTGG TGCGGGCGCG CGGCGGCAAG 
ATCGACCATC TCGACATCAC GGTGCTGGCG GAAGCCCCGC GCATCGGCCA GCACCGCGAG 
GCGATCCGCG CGCGTATCGC CGCGATCGCC GGCGTGCCGC TGTCCTCGGT GTCGATCAAG 
GCGACCACGA CCGAAAAGCT TGGCTTCGTC GGTCGCGCCG AGGGCCTCGC TGCCCAGGCC 
GCCGCGACGG TGCGGCTGCC GGAGGTCTGC GCGGAGCTGG AGACCGAGGC GGAGACCAAC 
GAGCGCCGTT CGTGA

Protein sequence

MSDQAARPPG QEPGNKSAAA VVVAAGKGLR VGGDLPKQYR RVGGRAVLTR TLAALAQSPR 
ITRIQPVIAP DAQDFYRECL ADLAPAHREK LAEPVPGGAT RQQSVAAGLE GLARLGAPDL 
VLVHDAARPF VDEALIARAI AAGSEHGASV PGIAVSDTIK LVEEIAPGIG RVHETPAREN 
LRAVQTPQSF RFGLLLDAHR RAVAEGRDGF TDDGALAEWA GLPVVVFEGD ARNRKITQAA 
DLIEADRAFS GRAFSEPAAA ISDDTMTTYV TRLGTGFDVH AFTEGDHVWL GGVKIPADRG 
VLAHSDGDVA LHALTDALLG AIADGDIGTH FPPSDEKWRG AASDQFLAHA CELVRARGGK 
IDHLDITVLA EAPRIGQHRE AIRARIAAIA GVPLSSVSIK ATTTEKLGFV GRAEGLAAQA 
AATVRLPEVC AELETEAETN ERRS