Gene TM1040_1364 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1364
Symbol
ID	4076381
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	1458902
End bp	1460050
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	62%
IMG OID	638006674
Product	2-C-methyl-D-erythritol 4-phosphate cytidylyltransferase 2-C-methyl-D-erythritol 2,4-cyclodiphosphate synthase
Protein accession	YP_613359
Protein GI	99081205
COG category	[I] Lipid transport and metabolism
COG ID	[COG0245] 2C-methyl-D-erythritol 2,4-cyclodiphosphate synthase [COG1211] 4-diphosphocytidyl-2-methyl-D-erithritol synthase
TIGRFAM ID	[TIGR00151] 2C-methyl-D-erythritol 2,4-cyclodiphosphate synthase [TIGR00453] 2-C-methyl-D-erythritol 4-phosphate cytidylyltransferase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCTCG CCGTATTGAT CGTTGCCGCC GGCAAAGGCA CCCGCGCAGG CGGTGGTCTC 
GCCAAGCAAT GGCGCCCACT GGCCGGGCGA CTGGTCATCG ACTGGACGAT CGAGGCCTTT 
CAACGTGCGG GGTGCGGCAC CATCATGGTT GTGCGCGATC CCGACAATGA GCACGCGATC 
GAGGCGCTTG CGCCCTACCC TGAATTATTG CTCGCAGATG GCGGTCCCTC GCGGTCTGAA 
TCCGTGCGTA ACGGTTTGAT TGCGCTCCAA GAGATCGGTG TCGAACGCGT TCTTATTCAT 
GACGCGGCGC GTCCATGTGT GTGTCCTCAG GTGATCCAAC AGGTGCTCGA CGCACTTGAT 
GACACGCCTG CTGCCGCGCC AGGACTTGCG GTGACAGATG CGCTTTGGAC CGGGGCCGAT 
GGCCATGTCA CAGGCACGCA GGACCGAAGC GCGCTCTTTG CGGCGCAAAC GCCGCAAGGC 
TTTCATTTTG ACGCGATCCT TGCGGCGCAT ATGCGCCACG ACGGCACCGC AGCGGATGAT 
GTCGAGGTTG CCCGTCAAGC GGGGCTCGCG GTCCGTATCA CGCCGGGTGA CGTCAATAAT 
ATCAAGATCA CCCGGCCCGA AGATTTCTCC CGCGCCGAGC ACATATTGAG GAGCACCATG 
GACAACATTC CTGACATCAG GCTTGGAAAT GGCTATGACG TTCACCGGTT CGGACCCGGG 
GATCATGTCA TGCTCTGTGG GGTTCAAGTG CCGCATGAGC GCGGTCTGCA AGGCCATTCC 
GATGCGGATG TGGGCATGCA CGCGGTCACC GACGCACTCT ACGGGGCGAT GGCAGAGGGC 
GACATCGGCC GCCACTTCCC GCCAAGCGAC CCTCAGTGGA AAGGCGCGGC GTCGGACATC 
TTCCTGCGCC ATGCGGTCGA ATTGGCACGC TCCAAAGGGT TCACCATCAA TAACGTGGAT 
TGCACCCTCG TCTGTGAATA CCCCAAAGTC GGCCCCCACG CAGAGGCGAT GCGCGCCCGG 
ATGGCAGAGA TCATGGGCAT GGATATGGGA CGCCTCTCGA TCAAGGCGAC AACTTCAGAG 
CGGCTTGGGT TCACCGGTCG CAAAGAAGGC ATCGCGGCAC TGGCGACAGC AACATTGGTG 
CGGGCATGA

Protein sequence

MTLAVLIVAA GKGTRAGGGL AKQWRPLAGR LVIDWTIEAF QRAGCGTIMV VRDPDNEHAI 
EALAPYPELL LADGGPSRSE SVRNGLIALQ EIGVERVLIH DAARPCVCPQ VIQQVLDALD 
DTPAAAPGLA VTDALWTGAD GHVTGTQDRS ALFAAQTPQG FHFDAILAAH MRHDGTAADD 
VEVARQAGLA VRITPGDVNN IKITRPEDFS RAEHILRSTM DNIPDIRLGN GYDVHRFGPG 
DHVMLCGVQV PHERGLQGHS DADVGMHAVT DALYGAMAEG DIGRHFPPSD PQWKGAASDI 
FLRHAVELAR SKGFTINNVD CTLVCEYPKV GPHAEAMRAR MAEIMGMDMG RLSIKATTSE 
RLGFTGRKEG IAALATATLV RA