Gene BURPS668_3936 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3936
Symbol	eutE
ID	4883892
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	3836179
End bp	3837891
Gene Length	1713 bp
Protein Length	570 aa
Translation table	11
GC content	67%
IMG OID	640129864
Product	acetaldehyde dehydrogenase (acetylating)
Protein accession	YP_001060929
Protein GI	126441324
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCCGCATT TGAACAACCG GCGCGCGACG AGTGTTCAGC AATGGCGCAG TCCGCCGCGC 
CGAGCGCGCG CCGAGCCCCG CGCCGGCGCC CCGATGCACC GCGGCGCGGC GTGCTGGCAC 
GGTTTTGGCG TAACGAACGG CGTCGCGCAC GTCGCGCGGC GCATCACCGA TACCGACATG 
CGAGGAGCAA CGATGAATCA CGCGGACATG CAACATCTGA ACATCGAATT CCCGTACCGC 
AAGCAGTACG GGAATTTCAT CGGCGGCGAA TGGGTCGCCC CGGTCGGCGG CGAGTATTTC 
GACAACGTCT CGCCCGTCAC CGGCCGGCCG TTCACCGCGA TCCCTCGCTC GCGCGAAGCC 
GACATCGAGC TCGCGCTCGA CGCCGCTCAC GCGGCCAAGG CGGGCTGGGC CGCGAAGGGC 
GCGGCCGAGC GCGCGAACGT GCTGCTGAGG ATCGCCGACC GGATGGAGGC GAACCTCACG 
CGCCTCGCCG TCGCCGAGAC GATCGACAAC GGCAAGCCGC TGCGCGAAAC CACCGCGGCC 
GACGTGCCGC TCGCGATCGA CCACTTCCGC TACTTCGCGG GCTGCATCCG CGCGCAGGAA 
GGCTCGATCG CCGATATCGG CGGCGACATG GTGGCCTACC ACTTCCACGA GCCGCTCGGC 
GTCGTCGGCC AGATCATCCC GTGGAACTTC CCGCTGCTGA TGGCCGCGTG GAAGCTCGCG 
CCGGCGCTCG CGGCCGGCAA CTGCGTCGTG CTCAAGCCGG CCGAGCAGAC GCCCGCGTCG 
ATCCTCGTGT TCGCCGAGCT GATCCAGGAT CTGCTGCCGC CCGGCGTGCT CAACATCGTC 
AACGGCTTCG GCCTCGAGGC CGGCAAGCCG CTCGCGTCGA GCAAGCGGAT CGCGAAGATC 
GCGTTCACGG GCGAGACGTC GACGGGCCGC CTCATCATGC AGTACGCGAG CGAGAACCTG 
ATTCCCGTCA CGCTCGAGCT GGGCGGCAAG AGCCCGAATA TTTTCTTCGC CGACGTGATG 
GATCGCGACG ACAGCTACTT CGACAAGGCG CTCGAAGGCT TCGCGATGTT CGCGCTGAAC 
CAGGGCGAAG TCTGCACGTG CCCATCGCGC GCGCTCGTCG AGGAGAGCAT CTACGATCGC 
TTCATCGAAC GCGCGCTCAA GCGCGTCGAG GCGATCAAGC AGGGCCATCC GCTCGATTCG 
CAGACGATGA TCGGCGCGCA GGCGTCGGCC GAGCAGCTCG AGAAGATCCT GTCGTACATC 
GACATCGGCC GCGGCGAAGG CGCGCAATGC CTGACGGGCG GCGAGCGCAA CGTGCTCGGC 
GGCGAGCTCG CCGAAGGCTA TTACGTGAAG CCGACCGTGT TCCGCGGCCA CAACAAGATG 
CGCATCTTCC AGGAAGAAAT CTTCGGGCCG GTGCTCGCGG TGACGACGTT CAAGACCGAG 
GAGGAAGCGC TCGAGATCGC GAACGACACG CTGTACGGCC TGGGCGCCGG CGTCTGGACG 
CGCGACGGCA ACCGCGCGTA CCGCTTCGGC CGCGGCATCC AGGCGGGCCG CGTGTGGACG 
AACTGCTATC ACGCGTATCC GGCGCACGCG GCGTTCGGCG GCTACAAGCA ATCCGGCATC 
GGCCGCGAGA CGCACAAGAT GATGCTCGAC CACTACCAGC AGACGAAGAA CCTGCTCGTC 
AGCTACAGCG AAAAGCCGCT CGGGTTCTTC TGA

Protein sequence

MPHLNNRRAT SVQQWRSPPR RARAEPRAGA PMHRGAACWH GFGVTNGVAH VARRITDTDM 
RGATMNHADM QHLNIEFPYR KQYGNFIGGE WVAPVGGEYF DNVSPVTGRP FTAIPRSREA 
DIELALDAAH AAKAGWAAKG AAERANVLLR IADRMEANLT RLAVAETIDN GKPLRETTAA 
DVPLAIDHFR YFAGCIRAQE GSIADIGGDM VAYHFHEPLG VVGQIIPWNF PLLMAAWKLA 
PALAAGNCVV LKPAEQTPAS ILVFAELIQD LLPPGVLNIV NGFGLEAGKP LASSKRIAKI 
AFTGETSTGR LIMQYASENL IPVTLELGGK SPNIFFADVM DRDDSYFDKA LEGFAMFALN 
QGEVCTCPSR ALVEESIYDR FIERALKRVE AIKQGHPLDS QTMIGAQASA EQLEKILSYI 
DIGRGEGAQC LTGGERNVLG GELAEGYYVK PTVFRGHNKM RIFQEEIFGP VLAVTTFKTE 
EEALEIANDT LYGLGAGVWT RDGNRAYRFG RGIQAGRVWT NCYHAYPAHA AFGGYKQSGI 
GRETHKMMLD HYQQTKNLLV SYSEKPLGFF