Gene BURPS1106A_2666 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2666
Symbol	pdhB
ID	4899693
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	2626342
End bp	2627988
Gene Length	1647 bp
Protein Length	548 aa
Translation table	11
GC content	70%
IMG OID	640135893
Product	dihydrolipoamide acetyltransferase
Protein accession	YP_001066919
Protein GI	126452707
COG category	[C] Energy production and conversion [I] Lipid transport and metabolism
COG ID	[COG0508] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide acyltransferase (E2) component, and related enzymes [COG4770] Acetyl/propionyl-CoA carboxylase, alpha subunit
TIGRFAM ID	[TIGR01348] pyruvate dehydrogenase complex dihydrolipoamide acetyltransferase, long form

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCAAG CGATCGAAGT CAAGGTGCCG GATATCGGCG ATTACAAGGA CGTGCCCGTC 
ATCGAAGTGC TCGTGAAGCC GGGCGATGCG GTCGAGCCCG AGCAGTCGCT CGTCACGCTC 
GAATCGGACA AGGCGACGAT GGACGTGCCG AGCCCGTCGG CGGGCACGGT CAAGGAAGTG 
AAGGTGAAGG TCGGCGACGC GGTGTCGCAA GGCTCGCTGA TCGTGCTGCT CGACGGCGCG 
CAGGCGGCGG CCCAGCCCGC GCAGGCGAAC GGCGCCGCGA CGAGCGCCGC GCAGCCGGCG 
GCGGCGCCCG CTGCCGCGCC TGCGCCGGCG GCGGCCGCGG GCGGCGGCAC GGTCGACGTG 
AAGGTGCCGG ACATCGGCGA CTACAAGGAC GTGCCCGTCA TCGAGATCGC CGTGAAGATC 
GGCGACACGG TCGAGAAGGA GCAGTCGCTC GTCACGCTCG AATCGGACAA GGCGACGATG 
GACGTGCCGA GCCCGGCCGC GGGCGTCGTC AAGGACATCA AGGTGAAGGT CGGCGATGCG 
GTGTCGGAAG GTTCGCTGAT CGTCGTGCTC GAAGCATCGG GCGGCGCCGC CGCGAGCGCG 
CCGCAGGCGG CCGCGCCCGC CCCCGCGCCG GCGCCCGCGC CCGCGCCCGC GCCCGCGCCG 
CAGGCCGCAC CCGCGGCTGC GCCGGCCCCC GCGCAGGCAC CGGCACCCGC CGCGAGCGGC 
GAGTACCGCG CGAGCCACGC GTCGCCGTCG GTGCGCAAGT TCGCGCGCGA GCTCGGCGTC 
GACGTGTCGC GCGTCACGGG CACGGGGCCG AAGAGCCGCA TCACGAAGGA CGACGTCACC 
GCGTTCGTGA AGGGCGTGAT GACGGGACAG CGCGCGGCGC CCGGCGCCGC GGCCGCGCCC 
GCGGGCGGCG GCGAGCTGAA CCTGCTGCCG TGGCCGAAGG TCGACTTCTC GAAGTTCGGC 
CCGTTCGAGG CGAAGCCGCT GTCGCGCATC AAGAAGATCT CGGGCGCGAA CCTGCATCGC 
AACTGGGTGA TGATCCCGCA CGTCACGAAC AACGACGAGG CGGACATCAC CGAGCTCGAA 
GCGCTGCGCG TGCAACTGAA CAAGGAGCAC GAGAAGGCGG GCGTGAAGTT CACGATGCTC 
GCGTTCGTGA TCAAGGCGGT CGTCGCCGCG CTGAAGAAGT TCCCGACCTT CAACGCGAGC 
CTCGATGGCG ACAACCTCGT GTTCAAGCAG TACTACCACA TCGGTTTCGC CGCCGACACG 
CCGAACGGCC TCGTCGTGCC GGTGATCCGC GACGCGGACA AGAAGGGGCT CGTCGACATC 
GCGAAGGAAA TGGCCGAGCT GTCGAAGGCC GCGCGCGAAG GCAAGCTCAA GCCGGACCAG 
ATGCAGGGCG GCTGCTTCTC GATCTCGTCG CTCGGCGGGA TCGGCGGCAC GCACTTCACG 
CCGATCATCA ATGCGCCGGA AGTGGCGATC CTCGGGCTGT CGCGCGGCCA GATGAAGCCG 
GTGTGGGACG GCAAGCAGTT TGTGCCGCGC CTCACGCTGC CGCTGTCGCT GTCGTATGAC 
CATCGCGTGA TCGATGGCGC GGAAGCCGCG CGGTTCAATG CGTATCTCGG CGCGTTGCTT 
GCCGATTTCC GTCGCATCAT TCTTTGA

Protein sequence

MSQAIEVKVP DIGDYKDVPV IEVLVKPGDA VEPEQSLVTL ESDKATMDVP SPSAGTVKEV 
KVKVGDAVSQ GSLIVLLDGA QAAAQPAQAN GAATSAAQPA AAPAAAPAPA AAAGGGTVDV 
KVPDIGDYKD VPVIEIAVKI GDTVEKEQSL VTLESDKATM DVPSPAAGVV KDIKVKVGDA 
VSEGSLIVVL EASGGAAASA PQAAAPAPAP APAPAPAPAP QAAPAAAPAP AQAPAPAASG 
EYRASHASPS VRKFARELGV DVSRVTGTGP KSRITKDDVT AFVKGVMTGQ RAAPGAAAAP 
AGGGELNLLP WPKVDFSKFG PFEAKPLSRI KKISGANLHR NWVMIPHVTN NDEADITELE 
ALRVQLNKEH EKAGVKFTML AFVIKAVVAA LKKFPTFNAS LDGDNLVFKQ YYHIGFAADT 
PNGLVVPVIR DADKKGLVDI AKEMAELSKA AREGKLKPDQ MQGGCFSISS LGGIGGTHFT 
PIINAPEVAI LGLSRGQMKP VWDGKQFVPR LTLPLSLSYD HRVIDGAEAA RFNAYLGALL 
ADFRRIIL