Gene Caul_2603 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2603
Symbol	ispDF
ID	5900058
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	2823454
End bp	2824605
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	70%
IMG OID	641563094
Product	bifunctional 2-C-methyl-D-erythritol 4-phosphate cytidylyltransferase/2-C-methyl-D-erythritol 2,4-cyclodiphosphate synthase protein
Protein accession	YP_001684228
Protein GI	167646565
COG category	[I] Lipid transport and metabolism
COG ID	[COG0245] 2C-methyl-D-erythritol 2,4-cyclodiphosphate synthase [COG1211] 4-diphosphocytidyl-2-methyl-D-erithritol synthase
TIGRFAM ID	[TIGR00151] 2C-methyl-D-erythritol 2,4-cyclodiphosphate synthase [TIGR00453] 2-C-methyl-D-erythritol 4-phosphate cytidylyltransferase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.328797
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTTCT CCGCCGTCAT CGTCGCCGCC GGTTCCGGAT CTCGCGCAGG CTCCGGCCAG 
GCCAAGCAAT GGCGGGTCGT GGCGGGGAAA CCCGTGTTGC GCTGGTCGGT CGAGGCCTTG 
TTGAAGGCCG GCGCCCAAAA CCTTGTGATC GTGGCGGATC CCGCCGCTCG CGAGGCCCTG 
GAAGACGCCC TCGACGGCCT TTCCGGCTGG ACCACGACGG CGGGCGGCGC GACTCGCGCG 
CGCTCCGTCC AGGCCGGATT GGCGGCCTTG ACCGAGCGTC CCGGCGCCGA GCCGGTGCTG 
ATCCATGACG CCGCTCGCCC CTTTCTCGGC GCCGCAACAA TCGCCTCGGT GCTGCGCGCC 
CTCGACGACG CCGATGGTGC AATTCCAGCC TTGCCGGTGG CCGATACGCT GAAAAGCGGA 
GCGCCCGACG CGGCCATTGT CACAAAATCG CGTGACGATC TGTGGCGCGC CCAGACCCCC 
CAGGCCTTCC GCCGCGACCG CCTGCTGGCC GCCTACGCCG CCTGGACCGG ACCGGACGAA 
CCGACCGACG ACGCCCAGGT GGTCGAGCGC CATGGCGGCC GCGTGGTCGT CACGCCGGGC 
GACCCGATGC TGATGAAACT GACCTATCCG GAGGACTTCG CCATGGCTGA ACGACTGGCC 
GGCGCGACGC GCGTCACCCG GATGGGCCAG GGCTTCGACG CCCACCGCTG GGGACCCGGC 
GAGTCGGTCT GGCTGTGCGG CGTGCAGATC GCCCACGACG AGACCCTGAT CGGCCATTCT 
GACGCCGACG CCGGGCTGCA CGCCCTGACC GACGCCATCC TCGGGGCGAT CGGCGAAGGC 
GACATCGGCG ACCACTTCCC GCCCACCGAT CCCCAATGGA AGGGCGCGGC GTCCGATAAG 
TTCCTGATCC ACGCCGTTGA TCTGGTTCGC CAACGTGGCG GGACCCTGGT CAATGTCGAC 
GTGACCCTGA TCTGCGAGCG GCCGAAGATC AAACCGCACC GCGCGGCCAT GCGGCAGCGC 
CTGGCCGATA TCCTCGACCT GCCGCTCGAC CGGGTGAGCG TCAAGGCGAC CACCACCGAG 
GGCATGGGCT TCACCGGCCG TGGCGAAGGC CTGGCCGCCC AGGCCATCGC CGTGGTCGAG 
ACGCCGGCAT GA

Protein sequence

MTFSAVIVAA GSGSRAGSGQ AKQWRVVAGK PVLRWSVEAL LKAGAQNLVI VADPAAREAL 
EDALDGLSGW TTTAGGATRA RSVQAGLAAL TERPGAEPVL IHDAARPFLG AATIASVLRA 
LDDADGAIPA LPVADTLKSG APDAAIVTKS RDDLWRAQTP QAFRRDRLLA AYAAWTGPDE 
PTDDAQVVER HGGRVVVTPG DPMLMKLTYP EDFAMAERLA GATRVTRMGQ GFDAHRWGPG 
ESVWLCGVQI AHDETLIGHS DADAGLHALT DAILGAIGEG DIGDHFPPTD PQWKGAASDK 
FLIHAVDLVR QRGGTLVNVD VTLICERPKI KPHRAAMRQR LADILDLPLD RVSVKATTTE 
GMGFTGRGEG LAAQAIAVVE TPA