Gene BURPS1106A_3053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3053
Symbol	zwf
ID	4901937
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	2982213
End bp	2983682
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	68%
IMG OID	640136279
Product	glucose-6-phosphate 1-dehydrogenase
Protein accession	YP_001067292
Protein GI	126454033
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0364] Glucose-6-phosphate 1-dehydrogenase
TIGRFAM ID	[TIGR00871] glucose-6-phosphate 1-dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATACCG ATTCGAGCTT CACCTTCGTT CTCTTCGGCG GCACCGGCGA TCTGTCGATG 
CGCAAGATCC TCCCCGCGCT CTTCGAAGCG CATCGCGCGA ACATGCTGTC GGAAGCCGGC 
AGGATCGTCG CCGTGGCCCG CCACGCGGCG GACCGCGAAG GCTACCTGCA GTGGGTCGAG 
GAGCACGTGA AGCCGCACGC GGCGAAGGCG GCGGGCGGCG CGTTCGACGA AGCGGTCTGG 
CGGAGCTTTC TCGAGCGCAT CGTCTACGTG AAGCTCGACC TCGGCCGCGC GGAAGATTAC 
GCGCTGCTGC GCGACACGGT CGGCGGGCTC TCGGGCATCC GCGTGTTCTA CCTGGCGACG 
GGCCCGTCGC TGTTCGTGCC GATCTGCAAG GCGCTCGCCG CGGTGGGCCT GAACGAAGGC 
GCGCGCATCG TGCTCGAGAA GCCGCTCGGC TACGACCTGC GCTCGTCGAA CGCGATCAAC 
GACGCGGTGG GCGAGATCTT CGCCGAAGAC CAGATCTACC GGATCGATCA CTACCTCGGC 
AAGGAGCCGG TGCAGAACCT GCTCGCGCTG CGCTTCGGCA ACGCGCTCTT CGAGCCGCTG 
TGGCGCCGCG AATGGGTGGA GAGCATCCAG ATCACGATCG CCGAGGAACT CGGCGTCGAG 
GCGCGCGGCG ATTTCTACGA CAATACCGGC GCGCTGCGCG ACATGGTGCA GAACCACCTG 
CTGCAGCTGC TGTCGATCGT CGCGATGGAG CCGCCGCACT CGATGGATTC CGATTCGGTG 
CGCGACGAGA AGCTGCGCGT GCTGCGCGCG TTGAAGCCCG TCGATCCGCG CGACATCGGC 
AAGGTCGCGG TGCGCGGCCA GTACCACGCG GGCGTGATCA AGGGCGCGCA GGTGCCCGCG 
TACGCGACCG AGCCCGGCGT GAAGGCGGAC AGCCAGACCG AGACGTTCGT CGCGCTGAAG 
GTCGAGATCG AGAACTGGCG CTGGGCCGGC GTGCCGTTCT TCCTGCGCAC CGGCAAGCGC 
CTCGCCGACC GCGTCGCGGA GATCGTCGTC AACTTCCGGC CGGTGCCGCA CTCGGCGCTC 
GGCCCCACCG CGCTGCGCGC GGGCGCGAAC CGTCTCGTGA TCCGGCTGCA GCCGAACGAA 
TCGATCCGCC TGTACTGCCT CGCGAAGCAG CCGGGCGAAG GGATGAACCT GGCAAGCGTG 
CACCTCGACC TCGCGTTCGA CCAGTTCTTC AAGGAAGGCC AGATGGAGGC GTACCAGCGC 
CTGCTGCTCG ACGTGATCAA CGGCCGCCTC GCGCTCTTCG TCCGGCGCGA CGAACAGGAA 
GCCGCATGGC GCTGGGTCGA GCCGATCCTG AACGAATGGG CGCGCACGAC GAAGCCGCCG 
AAGCCGTACG CGGCCGGCAC CTGGGGCCCG GCCGCGGCGA GCGCGATGCT CGCGCAGCAC 
GGCACCTGCT GGCTCGAAGA AGAAAACTGA

Protein sequence

MHTDSSFTFV LFGGTGDLSM RKILPALFEA HRANMLSEAG RIVAVARHAA DREGYLQWVE 
EHVKPHAAKA AGGAFDEAVW RSFLERIVYV KLDLGRAEDY ALLRDTVGGL SGIRVFYLAT 
GPSLFVPICK ALAAVGLNEG ARIVLEKPLG YDLRSSNAIN DAVGEIFAED QIYRIDHYLG 
KEPVQNLLAL RFGNALFEPL WRREWVESIQ ITIAEELGVE ARGDFYDNTG ALRDMVQNHL 
LQLLSIVAME PPHSMDSDSV RDEKLRVLRA LKPVDPRDIG KVAVRGQYHA GVIKGAQVPA 
YATEPGVKAD SQTETFVALK VEIENWRWAG VPFFLRTGKR LADRVAEIVV NFRPVPHSAL 
GPTALRAGAN RLVIRLQPNE SIRLYCLAKQ PGEGMNLASV HLDLAFDQFF KEGQMEAYQR 
LLLDVINGRL ALFVRRDEQE AAWRWVEPIL NEWARTTKPP KPYAAGTWGP AAASAMLAQH 
GTCWLEEEN