Gene BURPS1106A_A0738 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A0738
Symbol	fdhA
ID	4903433
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	726185
End bp	727384
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	67%
IMG OID	640143844
Product	glutathione-independent formaldehyde dehydrogenase
Protein accession	YP_001074774
Protein GI	126455852
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR02819] formaldehyde dehydrogenase, glutathione-independent

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAGCA ACCGAGGTGT CGTGTATCAG GGGCCGGGCA AGGTCGAAGT GCGGAAGATC 
GACTATCCGA AGATGGTCGA TCCGAGCGGC CGCGCGATCG GCCACGGCGT GATCCTGAAG 
GTCGTCAGCA CGAATATCTG CGGCTCCGAT CAGCACATGG TGCGCGGCCG CACGACGGCG 
CCCGTCGGTC TCGTGCTCGG CCACGAGATC ACGGGCGAGG TGATCGAGGT CGGCCGCGAT 
GTCGAGACGC TGAAGATCGG CGATCTCGTA TCGGTGCCGT TCAACGTCGC GTGCGGCCGC 
TGCGCGATGT GCAAGGAGCA GCACACGGGC GTATGCCTGA ACGTGAATCC GGCGCGCGCG 
GGCGGCGCGT ACGGCTATGT CGACATGGGC GGCTGGATCG GCGGGCAAGC CGAATACGTG 
CTCGTGCCGT ACGCCGACTT CAACCTGCTG AAATTCCCCG ATCGCGATCG GGCCATGGCG 
AAGATCCGCG ATCTCACGTG CCTGTCGGAC ATCCTGCCGA CCGGCTATCA CGGCGCGGTC 
ACGGCCGGCG TGAAGCCCGG CTCGACCGTC TACGTCGCGG GCGCGGGCCC GGTGGGGATG 
GCGGCCGCCG CGTCGGCGCG GCTGCTCGGC GCCGCATGCA CGATCGTCGG CGACATGAAC 
GCCGAGCGCC TCGCGCACGC GAAGGCGATG GGCTTCGAGG TGGTCGATCT GTCGAAGGAC 
GCGACGCTCG GCGAGCAGAT CGAGCAAATC CTCGGCAAGC CGGAGATCGA TTGCGCGGTT 
GACTGCGTCG GCTTCGAGGC GCACGGCCAC GGCTCGTCCG GCCATGCGCA GGAGGCGCCC 
GCGACGGTGC TGAACTCGCT GATGGAAATC ACCCGGCCCG CGGGCGCGAT CGGCATTCCG 
GGCCTGTACG TGACCGACGA TCCGGGCGCC GTCGATGTCG CCGCCAAGCA CGGCAGCCTG 
AGCATTCGTT TCGGTCTCGG CTGGGCGAAA TCGCATTCGT TCCATACCGG CCAGACGCCC 
GTGCTCAAGT ACAGCCGCAA CCTGATGCAG GCGATCCTGT TCGACCGGCT GCCGATCGCG 
GAAATCGTCA ACGTGGCGGT GATTTCGCTC GACGACGCGC CGGAGGGCTA CAAGAAGTTC 
GACGGCGGCG CGCCGCGCAA ATTCGTCATC GATCCGCACG GGATGCTGAA GGCGGCCTGA

Protein sequence

MSSNRGVVYQ GPGKVEVRKI DYPKMVDPSG RAIGHGVILK VVSTNICGSD QHMVRGRTTA 
PVGLVLGHEI TGEVIEVGRD VETLKIGDLV SVPFNVACGR CAMCKEQHTG VCLNVNPARA 
GGAYGYVDMG GWIGGQAEYV LVPYADFNLL KFPDRDRAMA KIRDLTCLSD ILPTGYHGAV 
TAGVKPGSTV YVAGAGPVGM AAAASARLLG AACTIVGDMN AERLAHAKAM GFEVVDLSKD 
ATLGEQIEQI LGKPEIDCAV DCVGFEAHGH GSSGHAQEAP ATVLNSLMEI TRPAGAIGIP 
GLYVTDDPGA VDVAAKHGSL SIRFGLGWAK SHSFHTGQTP VLKYSRNLMQ AILFDRLPIA 
EIVNVAVISL DDAPEGYKKF DGGAPRKFVI DPHGMLKAA