Gene BMA10229_A2041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMA10229_A2041
Symbol	glmU
ID	4793639
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei NCTC 10229
Kingdom	Bacteria
Replicon accession	NC_008836
Strand	+
Start bp	2066907
End bp	2068592
Gene Length	1686 bp
Protein Length	561 aa
Translation table	11
GC content	72%
IMG OID
Product	UDP-N-acetylglucosamine pyrophosphorylase
Protein accession	YP_001028005
Protein GI	124383571
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCGCGCA TCGCACGGCG GCCCGCACCG CCGGGGCACG CGTGTTCGCC CGCGCGCCGC 
ACGCTATCGC GCCCCGCCCG CTACATCCGT CTCGCCTCCT CCCCCGCGCC GCCCGACCTC 
GCCCGTCTTC CCGACCGCTT CGGGGCCACC CGTCGACGGC CTCGCGGCCG ACTCGCACTC 
CGGGCGTTCG TGCGGCTCGA ACGAACCTCG CGCCCCCGCC CGCCGGCCGC CGCCGCGCCC 
GGCTCGCCCG GCTGCCCAGC CGCGCCGGAC GGGGCCCGCA TGCTAGAATG GCCAGCTTCG 
AACTCTCCCT ACGAAACTGG CGCCATGAAT ATCGTGATTT TGGCGGCAGG CACCGGCAAG 
CGCATGCGTT CGGCGCTGCC GAAAGTGCTT CATCCTCTGG CCGGCAGGCC CCTTCTCTCC 
CACGTGATCG ATACCGCCCG CGCACTCGCG CCGTCCCGGC TCGTCGTCGT GATCGGCCAT 
GGCGCCGAGC AGGTGCGCGC GGCCGTCGCC GCGCCCGACG TGCAGTTCGC GGTGCAGGAG 
CAGCAGCTCG GCACCGGGCA CGCGGTGCGC CAGGCGCTGC CGCTGCTCGA CCCGTCGCAG 
CCGACGCTCG TGCTGTACGG CGACGTGCCG CTCACGCGCA CGGCGACACT CAAGCGCCTC 
GCCGACGCCG CGACCGACGC CCGCTACGGC GTGCTGACCG TCACGCTCGA CGATCCGACG 
GGCTACGGGC GCATCGTGCG CGATCAGGCC GGGTGCGTGA CGCGCATCGT CGAGCAGAAG 
GACGCGTCGC CCGACGAGTT GCGCATCGAC GAGATCAACA CGGGCATCGT CGTCGCGCCG 
ACCGCGCAGC TTTCGATGTG GCTCGGCGCG CTCGGCAACG ACAACGCGCA GGGCGAGTAC 
TATCTGACCG ACGTCGTCGA GCAGGCGATC GAAGCGGGCT TCGAGATCGT CACGACGCAG 
CCGGACGACG AGTGGGAGAC GCTCGGCGTG AACAGCAAGG CGCAGCTCGC CGAGCTCGAG 
CGCATTCATC AGCGCAACCT CGCCGACGCG CTGCTCGCCG CGGGCGTGAC GCTCGCCGAT 
CCGGCGCGCA TCGACGTGCG CGGCACGCTC GCGTGCGGGC GCGACGTGTC GATCGACGTG 
AATTGCGTGT TCGAAGGCGA CGTGACGCTC GCCGACGGCG TGACGATCGG CGCGAACTGC 
GTGATCCGCC ACGCGGCGAT CGCCGCGGGC GCGCGCGTGG ACGCGTTCTC GCATCTCGAC 
GGCGCGACGG TCGGCGCGAA CGCGGTCGTC GGCCCGTACG CGCGGCTGCG CCCGGGCGCG 
GTGCTCGCCG CCGACGCGCA CGTCGGCAAC TTCGTCGAGG TGAAGAACGC GACGCTCGGC 
CAAGGCTCGA AGGCGAACCA TCTGACCTAT CTCGGCGACG CGGACATCGG CGCGCGCGTG 
AACGTCGGCG CGGGCACGAT CACGTGCAAC TACGACGGCG CGAACAAGTT CCGCACGGTC 
ATCGAGGACG ACGTGTTCGT CGGCTCGGAC ACGCAGTTCG TCGCGCCGGT GCGCGTCGGC 
CGCGGCGTGA CGGTGGCGGC GGGCACGACC GTATGGAAGG ACGTCGCCGC GGACATGCTC 
GTGCTCAACG ACAAGACGCA GACCGCGAAG AGCGGCTACG TGCGCCCCGT CAAGAAGAAG 
AGCTGA

Protein sequence

MARIARRPAP PGHACSPARR TLSRPARYIR LASSPAPPDL ARLPDRFGAT RRRPRGRLAL 
RAFVRLERTS RPRPPAAAAP GSPGCPAAPD GARMLEWPAS NSPYETGAMN IVILAAGTGK 
RMRSALPKVL HPLAGRPLLS HVIDTARALA PSRLVVVIGH GAEQVRAAVA APDVQFAVQE 
QQLGTGHAVR QALPLLDPSQ PTLVLYGDVP LTRTATLKRL ADAATDARYG VLTVTLDDPT 
GYGRIVRDQA GCVTRIVEQK DASPDELRID EINTGIVVAP TAQLSMWLGA LGNDNAQGEY 
YLTDVVEQAI EAGFEIVTTQ PDDEWETLGV NSKAQLAELE RIHQRNLADA LLAAGVTLAD 
PARIDVRGTL ACGRDVSIDV NCVFEGDVTL ADGVTIGANC VIRHAAIAAG ARVDAFSHLD 
GATVGANAVV GPYARLRPGA VLAADAHVGN FVEVKNATLG QGSKANHLTY LGDADIGARV 
NVGAGTITCN YDGANKFRTV IEDDVFVGSD TQFVAPVRVG RGVTVAAGTT VWKDVAADML 
VLNDKTQTAK SGYVRPVKKK S