Gene BURPS1106A_A3067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A3067
Symbol
ID	4905694
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	2981851
End bp	2983083
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	68%
IMG OID	640146170
Product	2-oxoisovalerate dehydrogenase E1 component, alpha subunit
Protein accession	YP_001077096
Protein GI	126456753
COG category	[C] Energy production and conversion
COG ID	[COG1071] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.782804
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCAGT ACGGGCCATT GCGATTGCAT GTGCCGGAGC CTACCGGGCG TCCGGGATGC 
AAGACCGATT TTTCTTACCT GCGCCTGTCG CCAGCCGGCA AGGTGCGCAA ACCCCCCATC 
GACGTCGCCC CCGCCGACAC GAGCGACTTG GCCTATGGCC TCGTGCGCGT GCTCGACGAG 
CACGGACGAG CGGTCGGGCC ATGGGCGCCC GACCTCGATC CCGACATCTT GCGCAAAGGC 
ATCCGCGCGA TGCTGAAGAC GCGCATCTTC GACGCGCGCA TGCAGATCGC GCAGCGCCAG 
AAGAAGATCT CGTTCTACAT GCAGTGCCTC GGCGAGGAAG CGATCGCGGT CGCGCACACG 
CTCGCGCTCG AGCGCGGCGA CATGTGCTTT CCGACGTATC GGCAGCAAGG GATCCTGATG 
GTGCGCGAGT ATCCGCTCGT CGACATGATG TGCCAGCTGA TGTCGAACGA GCGCGATCCG 
CTGAAGGGCC GCCAGTTGCC GGTGATGTAC TCGACGCGCG ACGCGGGCTT CTTCTCGATC 
TCGGGCAATC TCGCGACGCA GTTCATCCAG GCGGTCGGCT GGGCGATGGC CTCGGCGATC 
AAGGGCGACA CGCGCATCGC TTCCGCGTGG ATCGGCGACG GCGCGACGGC CGAAGCCGAT 
TTCCATACCG CGCTCACGTT CGCACACGTG TACCGCGCGC CCGTGATCCT GAACGTGGTC 
AACAACCAGT GGGCGATCTC GACGTTCCAG GCGATCGCGG GCGGCGAGGG CGCGACCTTC 
GCCGGGCGCG GCGTCGGCTG CGGCATCGCT TCGCTGCGCG TGGACGGCAA CGATTTCCTC 
GCGGTCTACG CCGCGTCCCG CTGGGCGGCC GAACGCGCGC GCCGCAACCT CGGGCCGACG 
CTGATCGAGT GGGTCACGTA CCGCGCGGGC CCGCACTCGA CGTCCGACGA TCCGACCAAG 
TACCGCCCCG GCGACGACTG GACGAACTTC CCGCTCGGCG ATCCGCTCGA GCGCCTGAAG 
CGCCACATGA TCGGCATCGG CGTGTGGTCC GAGCAGGACC ACGAGGACAC GAAGGCCGCG 
CTCGAGGCCG AGGTGCTCGC CGCGCAGAAG GAAGCGGAGC GCTACGGCAC GCTGGCCGAC 
GAGCACGTGC CGAACGTCGC GAGCATTTTC GAGGACGTCT ACAAGGAGAT GCCCGCGCAC 
CTGCGCCGGC AGCGCCAACA GCTCGGGGTT TGA

Protein sequence

MSQYGPLRLH VPEPTGRPGC KTDFSYLRLS PAGKVRKPPI DVAPADTSDL AYGLVRVLDE 
HGRAVGPWAP DLDPDILRKG IRAMLKTRIF DARMQIAQRQ KKISFYMQCL GEEAIAVAHT 
LALERGDMCF PTYRQQGILM VREYPLVDMM CQLMSNERDP LKGRQLPVMY STRDAGFFSI 
SGNLATQFIQ AVGWAMASAI KGDTRIASAW IGDGATAEAD FHTALTFAHV YRAPVILNVV 
NNQWAISTFQ AIAGGEGATF AGRGVGCGIA SLRVDGNDFL AVYAASRWAA ERARRNLGPT 
LIEWVTYRAG PHSTSDDPTK YRPGDDWTNF PLGDPLERLK RHMIGIGVWS EQDHEDTKAA 
LEAEVLAAQK EAERYGTLAD EHVPNVASIF EDVYKEMPAH LRRQRQQLGV