Gene BURPS1106A_1006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_1006
Symbol
ID	4901159
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	985122
End bp	986018
Gene Length	897 bp
Protein Length	298 aa
Translation table	11
GC content	70%
IMG OID	640134236
Product	putative dihydrodipicolinate synthase
Protein accession	YP_001065287
Protein GI	126454975
COG category	[E] Amino acid transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0329] Dihydrodipicolinate synthase/N-acetylneuraminate lyase
TIGRFAM ID	[TIGR00674] dihydrodipicolinate synthase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCAACC TCTTGCAAGG CATCATCGCC TACCCCGTCA CGCCCTTCTC GCCGGACGGC 
CGGCTCGACA CGGCCGCGCT CGGCGCGCTC ATCGAACGCC TGATCGCGAG CGGCGTGCAC 
GGCATCGCGC CGCTCGGCAG CACCGGCGAA AGCGCCTATC TGTCCGACGC CGAATGGGAA 
GCCGCCGCGT CGGCCTCGAT TCGCGCGGTC GAGCGCCGCG TGCCGACCGT CGTCGGCATT 
TCCGATCTCA CCACCGCGAA CGCGGTGCGC CGCGCGAAAT TCGCCGAACA GGCGGGCGCG 
GACGCGGTCA TGGTGCTGCC CGTGTCGTAC TGGCGGCTCG ACGACGAAGC GATCGTCGGC 
CACTACCGCG CGATCGGCGA CGCGATCGGC ATTCCGATCA TGCTGTACAA CAACCCGGCG 
ACGAGCGGCA TCGACATGTC GCCCGAGCTG ATCGCGCGCA TCTTCCGCAC GGTCGACAAC 
GTGACGATGG TCAAGGAGAG CACGGGCGAC ATCAAGCGCA TGCACCGGCT CGCGCAACTG 
GGCGACGGCG CGATCCCGTT CTACAACGGC AGCAATCCGA TGGCGCTCGC CGCGCTCGCG 
GCCGGCGCGG CCGGCTGGTG CACCGCCGCG CCGAACCTGA ACGCGCGCCT GCCGCTCGCG 
TTATACGACG CGATGCGCGC AAGCGATCTC GACACGGCGC GCGCCGTCTT TCATCGACAG 
TTGCCGCTGT TGCAGTTCAT CGTCTCGGGC GGGCTGCCCG TCACGGTGAA GGCCGGGCTG 
CGGCTCGCGG GCTTCGACGC GGGCGAGCCG CGCAAGCCGC TGCGCCCGCT CGACGAAGCG 
CGCACGCGCG AGCTCGCCGC GATTCTCGAC GCGCTGCGCG ACACCGCGCA CGCGTGA

Protein sequence

MSNLLQGIIA YPVTPFSPDG RLDTAALGAL IERLIASGVH GIAPLGSTGE SAYLSDAEWE 
AAASASIRAV ERRVPTVVGI SDLTTANAVR RAKFAEQAGA DAVMVLPVSY WRLDDEAIVG 
HYRAIGDAIG IPIMLYNNPA TSGIDMSPEL IARIFRTVDN VTMVKESTGD IKRMHRLAQL 
GDGAIPFYNG SNPMALAALA AGAAGWCTAA PNLNARLPLA LYDAMRASDL DTARAVFHRQ 
LPLLQFIVSG GLPVTVKAGL RLAGFDAGEP RKPLRPLDEA RTRELAAILD ALRDTAHA