Gene BURPS1106A_2228 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2228
Symbol	ispG
ID	4902675
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	2216794
End bp	2218044
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	69%
IMG OID	640135457
Product	4-hydroxy-3-methylbut-2-en-1-yl diphosphate synthase
Protein accession	YP_001066492
Protein GI	126452211
COG category	[I] Lipid transport and metabolism
COG ID	[COG0821] Enzyme involved in the deoxyxylulose pathway of isoprenoid biosynthesis
TIGRFAM ID	[TIGR00612] 1-hydroxy-2-methyl-2-(E)-butenyl 4-diphosphate synthase

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0113793
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTTCGGCG GGCATGCGCC GCGGCGCGTG TCGCATGCGG TCGATGTCCG CTGGGGCGGC 
ACGCTCGTGA CGATCGGCGG CGCGGCGCCC GTGCGCGTGC AGTCGATGAC GAACACCGAT 
ACGGCCGACG CGATCGGCAC CGCGATCCAG GTGAAGGAGC TCGCGAACGC GGGCTCCGAG 
CTCGTGCGCA TCACCGTGAA CACGCCGGAG GCGGCCGCTG CCGTGCCGGC GATTCGCGAG 
CAGCTCGACC GGATGGGCGT GACGGTGCCG CTTGTCGGCG ATTTCCACTA CAACGGCCAC 
CTGCTGCTGC GCGACTACCC GGACTGCGCG CAGGCGCTGT CGAAATACCG GATCAACCCG 
GGCAACGTCG GCCAGGGCGC GAAGCGCGAT TCGCAGTTCG CGCAGATGAT CGAAGCCGCG 
ATCAAGTACG ACAAGCCGGT GCGGATCGGC GTGAACTGGG GCAGCCTCGA TCAGGACCTG 
CTCGCGCGGA TGATGGACGA GAACGGCGCG CGCGCCGAGC CGTGGGAGGC GCAGAGCGTG 
ATGTACGAGG CGCTGATCCA GTCGGCGATC GGCTCGGCCG AGCGCGCGGT CGAGCTCGGC 
CTCGGCCGCG ACAAGATCGT GCTGTCGTGC AAGGTGAGCG GCGTGCAGGA CCTGGTCGCC 
GTGTACCGCG AACTGTCACG CCGCTGCGGC TTCGCGCTGC ACCTCGGCCT CACCGAGGCG 
GGCATGGGCT CGAAGGGCAT CGTCGCGTCG ACCGCGGCGA TCGGTCTGCT GCTGCAGGAA 
GGCATCGGCG ACACGATCCG CATCTCGCTC ACGCCGGAGC CGGGCGCGCC GCGCACGGGC 
GAAGTGGTGG TCGGCCAGGA GATCCTGCAG ACGATGGGGC TGCGCTCGTT CGCGCCGATG 
GTCGTCGCGT GTCCGGGCTG CGGCCGCACG ACGAGCACGC TGTTCCAGGA GCTCGCGCTG 
CGGATCCAGA CCTACCTGCG CGAACAGATG CCCGTGTGGC GCAGCGAATA CCCGGGCGTC 
GAGAAGATGA ACGTCGCGGT GATGGGGTGC ATCGTCAACG GCCCGGGCGA GTCGAAGCAC 
GCGAACATCG GCATCAGCCT GCCGGGCTCG GGCGAGAATC CGGCCGCGCC GGTGTTCGTC 
GACGGCGAGA AAGTGAAGAC GCTGCGCGGC GAGCACATCG CGGAAGAGTT CCAGCAGATC 
GTGAGCGACT ACGTCGCGCG CACCTACGGC CGCGCCGCGG CGCAGAATTA A

Protein sequence

MFGGHAPRRV SHAVDVRWGG TLVTIGGAAP VRVQSMTNTD TADAIGTAIQ VKELANAGSE 
LVRITVNTPE AAAAVPAIRE QLDRMGVTVP LVGDFHYNGH LLLRDYPDCA QALSKYRINP 
GNVGQGAKRD SQFAQMIEAA IKYDKPVRIG VNWGSLDQDL LARMMDENGA RAEPWEAQSV 
MYEALIQSAI GSAERAVELG LGRDKIVLSC KVSGVQDLVA VYRELSRRCG FALHLGLTEA 
GMGSKGIVAS TAAIGLLLQE GIGDTIRISL TPEPGAPRTG EVVVGQEILQ TMGLRSFAPM 
VVACPGCGRT TSTLFQELAL RIQTYLREQM PVWRSEYPGV EKMNVAVMGC IVNGPGESKH 
ANIGISLPGS GENPAAPVFV DGEKVKTLRG EHIAEEFQQI VSDYVARTYG RAAAQN