Gene BURPS668_A1443 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A1443
Symbol
ID	4888395
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	1349182
End bp	1350483
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	68%
IMG OID	640131382
Product	putative UDP-N-acetylglucosamine 1-carboxyvinyltransferase
Protein accession	YP_001062440
Protein GI	126443121
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0766] UDP-N-acetylglucosamine enolpyruvyl transferase
TIGRFAM ID	[TIGR01072] UDP-N-acetylglucosamine 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGAACC TGATCGTCCA CGGCGGCGCC CCGCTTCGCG GAGAAATCAC GCCGTCCGCC 
AACAAGAACG CCGTCCTGCC CATCCTGTGC GCGACGCTCC TCACCGACCG GCCGCTGCGG 
CTCGTCGGCG TGCCGGACAT CACCGACGTG CGCAAGATCC TCGACATCTT CCGCACGCTC 
GGCAGCGACG TCTCGATCGA TTACGCGAGC GGCGTGCTCG ATCTGCACCA TCGCGCGACC 
GCGTTCGATC CGGCCGTCCA CCGGCTGCCG GAGGAGATGC GCTCGTCGAT CATGCTGGTG 
CCGCCGCTGC TCGCGCGCTT CGGCGTCGCG CGGCTCGAGA ACGACGTAAA GGGCTGCACG 
CTCGGCGTGC GCGAGATCGA TCCGCACGTC GAAGTGTTCG AGCGCTTCGG CGCGCGCATC 
GAGCGCACGT CCGATTCGCT GATCGTGCGC GCCGACGGCC CGCTCACGCC GAATCATCAC 
TGGCTCGACT ACGCGTCCGT CACGACGACC GAGAACTTCG TGCTGTGCGC CGCGTCGGCG 
AACGGCACGT CGACGCTCGT CAATGCCGCG TCGGAGCCGC ACGTGCAGGA GTTCTGCCGG 
TTCCTCGCGA TGCTCGGCGT GCCGATCGAG GGCATCGGCA CATCGCACCT GAGCGTTCAG 
GGCGGGCGCG CGCTCGCGGG CGGCGAATAC CGCTTCAACG AGGACTTTCA CGAAATCGCG 
ACGTTTCTCG CGCTCGGCGC GATCACGGGC GGCGACATCG CGGTGCGCAA CGGCTCGCCC 
GAGCAGTTTC CGCTGATCGA TCGGACCTTC GCGAAATTCG GCGTGCAGGT CACGCACGAG 
AACGGCTGGT CGCACGCGCT GCGCGACGGC CCGCTGAAGG TCAAGCAGCC GTTCACGCGC 
AACATCCTGA CGAAAGTCGA GGCCGCGCCG TGGCCCTACC TGCCCGTCGA TCTGCTGCCG 
ATCTTCATCG CGCTCGGCGT GCAGGCGCAA GGCAGCGTGA TGTTCTGGAA CAAGGTGTAT 
GACGGCGCGA TGGGCTGGAC GGGCGAGCTG TCGAAGTTCG GCGCGCACGT GTTCCTGTCC 
GATCCGCATC GGCTGATCAC GTTCGGCGGG CTGCCGCTCA GCCCGGCGCG CGTCGAGAGC 
CCGTACATCA TCCGCGTCGC GATCGCGCTG CTGATGGTCG CCGCGAGCAT CGACGGACGC 
TCGGAGATCC TGAACGCACA GCCGATCCGG CGCGCGCATC CGCACTTCGT CGAGAACCTG 
CGCTCGGTCG GCGCGAACGT CGAGTGGACG AGCGGCGAAT GA

Protein sequence

MSNLIVHGGA PLRGEITPSA NKNAVLPILC ATLLTDRPLR LVGVPDITDV RKILDIFRTL 
GSDVSIDYAS GVLDLHHRAT AFDPAVHRLP EEMRSSIMLV PPLLARFGVA RLENDVKGCT 
LGVREIDPHV EVFERFGARI ERTSDSLIVR ADGPLTPNHH WLDYASVTTT ENFVLCAASA 
NGTSTLVNAA SEPHVQEFCR FLAMLGVPIE GIGTSHLSVQ GGRALAGGEY RFNEDFHEIA 
TFLALGAITG GDIAVRNGSP EQFPLIDRTF AKFGVQVTHE NGWSHALRDG PLKVKQPFTR 
NILTKVEAAP WPYLPVDLLP IFIALGVQAQ GSVMFWNKVY DGAMGWTGEL SKFGAHVFLS 
DPHRLITFGG LPLSPARVES PYIIRVAIAL LMVAASIDGR SEILNAQPIR RAHPHFVENL 
RSVGANVEWT SGE