Gene BURPS1106A_0587 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_0587
Symbol	ipk
ID	4903182
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	555449
End bp	556330
Gene Length	882 bp
Protein Length	293 aa
Translation table	11
GC content	63%
IMG OID	640133817
Product	4-diphosphocytidyl-2-C-methyl-D-erythritol kinase
Protein accession	YP_001064869
Protein GI	126452519
COG category	[I] Lipid transport and metabolism
COG ID	[COG1947] 4-diphosphocytidyl-2C-methyl-D-erythritol 2-phosphate synthase
TIGRFAM ID	[TIGR00154] 4-diphosphocytidyl-2C-methyl-D-erythritol kinase

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0416429
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGATA CGACCCGCTC GCTGCGCGAC TGCCTCGCCC CGGCGAAACT GAACCTGTTC 
CTGCACATCA CGGGCCGCCG CCCGGACGGC TATCACGCGC TGCAAAGCGT GTTCCAGCTG 
CTCGACTGGG GCGACCGGCT GCACTTCACG CTGCGCGACG ACGGCAAGGT CTCGCGCGTG 
ACGGACGTGC CGGGCGTGCC CGAGGAATCC GACCTCGTCG TGCGCGCCGC GTCGCTGCTG 
AAGGCGCACG CCGGCGCGAC GCTGGGCGTC GACATCGAGA TCGACAAGCG GCTGCCGATG 
GGCGCGGGCC TGGGCGGCGG CAGCTCGGAC GCGGCGACGA CGTTGCTCGC GCTCAACCGG 
CTATGGCGGC TCGACCTGCC GCGCACCACG CTGCAATCGC TCGCGGTGAA GCTCGGCGCC 
GACGTGCCGT TCTTCGTCTT CGGAAAAAAT GCGTTCGCGG AGGGTATCGG AGAAGCGCTA 
CAAGCTGTAG AATTGCCGGC TCGCTGGTTC CTGGTTGTGA CACCGCGGGT TCACGTGCCG 
ACGGCAGCGA TTTTTTCCGA AAAATCGTTG ACAAGAGATT CGAAACCCAT CACAATTACG 
GACTTTCTTG CACAGCGCGG CATCGACGCA GGATGGCCAG ACAGCTTCGG CCGGAATGAC 
ATGCAGCCGG TTGTGACAAG CAAGTACGCG GAAGTTGCAA AGGTGGTCGA ATGGTTTTAT 
AATCTGACCC CCGCGCGGAT GACCGGCTCT GGAGCGAGCG TGTTTGCAGC GTTCAAGAGC 
AAGGCTGATG CAGAAGCGGC GCAAGCCAAA CTGCCTGCCG GCTGGAACAG CGCAGTTGCC 
GAGAGCATGA GTGAGCATCC ACTCTTCGCT TTTGCGTCAT AA

Protein sequence

MTDTTRSLRD CLAPAKLNLF LHITGRRPDG YHALQSVFQL LDWGDRLHFT LRDDGKVSRV 
TDVPGVPEES DLVVRAASLL KAHAGATLGV DIEIDKRLPM GAGLGGGSSD AATTLLALNR 
LWRLDLPRTT LQSLAVKLGA DVPFFVFGKN AFAEGIGEAL QAVELPARWF LVVTPRVHVP 
TAAIFSEKSL TRDSKPITIT DFLAQRGIDA GWPDSFGRND MQPVVTSKYA EVAKVVEWFY 
NLTPARMTGS GASVFAAFKS KADAEAAQAK LPAGWNSAVA ESMSEHPLFA FAS