Gene BURPS1106A_A2642 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2642
Symbol
ID	4903958
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	2584188
End bp	2585261
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	67%
IMG OID	640145745
Product	zinc-binding dehydrogenase family oxidoreductase
Protein accession	YP_001076672
Protein GI	126455793
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0311111
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCGTGACC GATACTCGAT CGGACATCGA ACCAACCGGG AGCGATTGAT GGCGCAATAC 
ATGAAGGCCG CGGTGGTGCA TGCATTCGGC GAACCGCTTC GGATCGAGGA GGTGCCCGTG 
CCGACGCCCG GCGCGGGGCA GATTCTCGTG AACGTCAAGG CATCGGGCGT GTGCCATACC 
GATCTGCACG CGGCCGACGG CGACTGGCCC GTCAAGCCGA CGCTGCCGTT CATTCCGGGG 
CACGAGGGCG TCGGCTTCGT CGCGGCGGTG GGCGAAGGCG TGAGGCACGT GAAGGAGGGC 
GATCGCGTCG GCGTGCCTTG GCTCTATACC GCGTGCGGCC ATTGCGAGTA TTGCCAGACC 
GGCTGGGAGA CGCTGTGCCA CGAGCAGCAG AACACCGGCT ATTCGGTGAA CGGCAGCTAC 
GCGGAATACG TGCTCGCCGA TCCGAACTAC GTCGGCCATC TGCCGAGCAA CGTCGCGTTC 
GACGAGATCG CGCCGATCCT GTGCGCGGGC GTGACCGTCT ACAAGGGCAT TCGGGTGACC 
GACACGCGCC CGGGGCAATG GATCGCGATC TCGGGGATCG GCGGGCTCGG GCACGTCGCG 
GTGCAGTACG CGAAGGCGAT GGGGCTGCAC GTGGTCGCGG TGGACGTCGC GCCGCAGAAG 
CTCGAGCTTG CGCGCAAGCT GGGCGCGACG TTCGTCGTCG ATGCGTCGAA GGACGATCCG 
GCGGCGGTGA TCCAGAAGGA GATCGGCGGC GTGCACGGCG TGCTCGTGAC GGCCGTGTCG 
CGCGGCGCGT TCGCGCAGGC GCTCGGCATG GTGAGGCGCG GCGGGACGGT CTCGCTGAAC 
GGGCTGCCGC CGGGCGATTT TCCGCTGCCG ATCTTCTCGA CGGTGCTCAA CGGGATCACG 
GTGCGAGGCT CGATCGTCGG CACGCGGCGC GATCTCCAGG AATCGCTCGA TTTCGCGGCC 
GAAGGGCTCG TGCGCGCGCA TATCCATCGC GACAAGCTCG AGCACATCAA CGGCGTGTTC 
TCGGCGCTGC GTGAAGGGAA GGTCGACGGG CGGATCGTGT TGACCGGGCA ATGA

Protein sequence

MRDRYSIGHR TNRERLMAQY MKAAVVHAFG EPLRIEEVPV PTPGAGQILV NVKASGVCHT 
DLHAADGDWP VKPTLPFIPG HEGVGFVAAV GEGVRHVKEG DRVGVPWLYT ACGHCEYCQT 
GWETLCHEQQ NTGYSVNGSY AEYVLADPNY VGHLPSNVAF DEIAPILCAG VTVYKGIRVT 
DTRPGQWIAI SGIGGLGHVA VQYAKAMGLH VVAVDVAPQK LELARKLGAT FVVDASKDDP 
AAVIQKEIGG VHGVLVTAVS RGAFAQALGM VRRGGTVSLN GLPPGDFPLP IFSTVLNGIT 
VRGSIVGTRR DLQESLDFAA EGLVRAHIHR DKLEHINGVF SALREGKVDG RIVLTGQ