Gene BURPS668_A2784 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A2784
Symbol
ID	4887192
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	2657019
End bp	2658044
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	68%
IMG OID	640132720
Product	zinc-binding dehydrogenase family oxidoreductase
Protein accession	YP_001063776
Protein GI	126442465
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.95808
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGCAAT ACATGAAGGC CGCGGTGGTG CATGCATTCG GCGAACCGCT TCGGATCGAG 
GAGGTGCCCG TGCCGACGCC CGGCGCGGGG CAGATTCTCG TGAACGTCAA GGCATCGGGC 
GTGTGCCATA CCGATCTGCA CGCGGCCGAC GGCGACTGGC CCGTCAAGCC GACGCTGCCG 
TTCATTCCGG GGCACGAGGG CGTCGGCTTC GTCGCGGCGG TGGGCGAAGG CGTGAGGCAC 
GTGAAGGAGG GCGATCGCGT CGGCGTGCCT TGGCTCTATA CCGCGTGCGG CCATTGCGAG 
TATTGCCAGA CCGGCTGGGA GACGCTGTGC CACGAGCAGC AGAACACCGG CTATTCGGTG 
AACGGCAGCT ACGCGGAATA CGTGCTCGCC GATCCGAACT ACGTCGGCCA TCTGCCGAGC 
AACGTCGCGT TCGACGAGAT CGCGCCGATC CTGTGCGCGG GCGTGACCGT CTACAAGGGC 
ATTCGGGTGA CCGACACGCG CCCGGGGCAA TGGATCGCGA TCTCGGGGAT CGGCGGGCTC 
GGGCACGTCG CGGTGCAGTA CGCGAAGGCG ATGGGGCTGC ACGTGGTCGC GGTGGACGTC 
GCGCCGCAGA AGCTCGAGCT TGCGCGCAAG CTGGGCGCGG CGTTCGTCGT CGATGCGTCG 
AAGGACGATC CGGCGGCGGT GATCCAGAAG GAGATCGGCG GCGTGCACGG CGTGCTCGTG 
ACGGCCGTGT CGCGCGGCGC GTTCGCGCAG GCGCTCGGCA TGGTGAGGCG CGGCGGGACG 
GTCTCGCTGA ACGGGCTGCC GCCGGGCGAT TTTCCGCTGC CGATCTTCTC GACGGTGCTC 
AACGGGATCA CGGTGCGAGG CTCGATCGTC GGCACGCGGC GCGATCTCCA GGAATCGCTC 
GATTTCGCGG CCGAAGGGCT CGTGCGCGCG CATATCCATC GCGACAAGCT CGAGCACATC 
AACGGCGTGT TCTCGGCGCT GCGCGAAGGG AAGGTCGACG GGCGGATCGT GTTGACCGGG 
CAATGA

Protein sequence

MAQYMKAAVV HAFGEPLRIE EVPVPTPGAG QILVNVKASG VCHTDLHAAD GDWPVKPTLP 
FIPGHEGVGF VAAVGEGVRH VKEGDRVGVP WLYTACGHCE YCQTGWETLC HEQQNTGYSV 
NGSYAEYVLA DPNYVGHLPS NVAFDEIAPI LCAGVTVYKG IRVTDTRPGQ WIAISGIGGL 
GHVAVQYAKA MGLHVVAVDV APQKLELARK LGAAFVVDAS KDDPAAVIQK EIGGVHGVLV 
TAVSRGAFAQ ALGMVRRGGT VSLNGLPPGD FPLPIFSTVL NGITVRGSIV GTRRDLQESL 
DFAAEGLVRA HIHRDKLEHI NGVFSALREG KVDGRIVLTG Q