Gene BURPS1106A_3757 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3757
Symbol	aroB
ID	4902987
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	3669227
End bp	3670306
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	68%
IMG OID	640136983
Product	3-dehydroquinate synthase
Protein accession	YP_001067987
Protein GI	126455013
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTACCG TCAACGTCGA CCTGGGCGAG CGCGCCTATC CGATCCACAT CGGCGCCGAT 
CTGATCGGCC GCACCGAGCT TTTCGCGCCG CACATCGCGG GCGCATCCGT CACGATCGTC 
ACGAACACCA CCGTCGAGCC GCTCTACGGC GACACGCTGC GCGCCGCGCT CGCGCCGCTC 
GGCAAGCGCG TGTCGACCGT CGTCCTGCCC GACGGCGAAG CGTACAAGAA CTGGGAAACG 
CTCAATCTGA TCTTCGACGG CCTGCTCGAG CAGCACGCCG ATCGCAAGAC GACGCTGATC 
GCGCTCGGCG GCGGCGTGAT CGGCGACATG ACGGGCTTCG CGGCCGCATG CTATATGCGC 
GGCGTGCCGT TCATCCAGGT GCCGACGACG CTCCTGTCGC AGGTTGATTC GTCGGTCGGC 
GGCAAGACGG GCATCAACCA TCCGCTCGGC AAGAACATGA TCGGCGCGTT CTATCAGCCG 
CAGGCGGTGA TCGCCGATAT CGGCGCGCTG TCGACGCTGC CCGATCGCGA GCTTGCCGCG 
GGCGTCGCCG AGATCGTCAA GACGGGCGCG ATCGCCGATG CCGCGTTCTT CGACTGGATC 
GAGGCGAACG TGGGCGCGCT CACTCGCCGC GATCCCGACG CGCTCGCGCA CGCGGTCAAG 
CGCTCGTGCG AGATCAAGGC GGGCGTCGTC GCGGCGGACG AGCGCGAGGG CGGTCTGCGC 
GCGATCCTCA ATTTTGGCCA TACGTTCGGG CACGCGATCG AAGCGGGGCT CGGCTACGGC 
GAGTGGCTGC ACGGCGAGGC GGTGGGCTGC GGCATGGTGA TGGCGGCCGA CCTGTCGGTG 
CGAACCGGCC ATCTCGACGA AGCGTCGCGC GCGCGGCTGT GCCGCGTCGT CGAGGCCGCG 
CATCTGCCGA CGCGCGCGCC GGATCTCGGC GACGCGCGTT ATGTCGAGCT GATGCGCGTC 
GACAAGAAGG CCGAGGCGGG CGCGATCAAG TTCATACTGC TCAAACGCTT CGGCGAAACG 
ATCATCACTC CGGCGCCCGA CGACGCCGTT CTCGCGACAC TGGCGGCAAC CACCCGGTAA

Protein sequence

MITVNVDLGE RAYPIHIGAD LIGRTELFAP HIAGASVTIV TNTTVEPLYG DTLRAALAPL 
GKRVSTVVLP DGEAYKNWET LNLIFDGLLE QHADRKTTLI ALGGGVIGDM TGFAAACYMR 
GVPFIQVPTT LLSQVDSSVG GKTGINHPLG KNMIGAFYQP QAVIADIGAL STLPDRELAA 
GVAEIVKTGA IADAAFFDWI EANVGALTRR DPDALAHAVK RSCEIKAGVV AADEREGGLR 
AILNFGHTFG HAIEAGLGYG EWLHGEAVGC GMVMAADLSV RTGHLDEASR ARLCRVVEAA 
HLPTRAPDLG DARYVELMRV DKKAEAGAIK FILLKRFGET IITPAPDDAV LATLAATTR