Gene BURPS668_A1779 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A1779
Symbol
ID	4886540
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	1725938
End bp	1727095
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	71%
IMG OID	640131717
Product	iron-containing alcohol dehydrogenase
Protein accession	YP_001062774
Protein GI	126444714
COG category	[C] Energy production and conversion
COG ID	[COG1979] Uncharacterized oxidoreductases, Fe-dependent alcohol dehydrogenase family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGAATT TCGATTTCTA CAACCCGACC CGGATCGTCT TCGGCGAAAA GACGGCCGCG 
CGGCTGAACG ATCTGCTGCC GGCGGCGGCC CGCGTGCTCG TGCTGTACGG CGGCGAGAGC 
GCGCGCAGCA ACGGCACGCT CGACGAGGTC CGCGCCGCGC TCGGCGCGCG CGACGTGCGC 
GAGTTCGGCG GGATCGAGCC GAACCCGGCC TACGAGACGC TGATGCGGGC GGTCGAGCTC 
GCGCGGCGCG AGCGTGTGGA TTTCCTGCTC GCGGTCGGCG GCGGCTCGGT GATCGACGGC 
ACGAAGTTCG TCGCGGCCGC GGTGCCGTTC GAGGGCGATC CGTGGACCAT CCTCGAGACG 
CACGGCGCGA ACGTCGCGGC GGCGCTGCCG TTCGGCTGCG TGCTGACGCT GCCCGCGACG 
GGCTCGGAGA TGAACAACGG CGCGGTCCTC ACGCGCCGCG CGACGCGCGC GAAGCTCGCG 
TTCCGCCATC CGCTCGTGTT TCCGACGTTC TCGATTCTGG ACCCGACGAA GACCTACACG 
CTGCCGCCGC GGCAGGTGGC GAACGGCGTC GTCGACGCGT TCACGCACAT CGTCGAGCAG 
TACCTGACGT ATCCGGCCGA CGGCCTCGCG CAGGACCGCT TCGCCGAGGG CCTGCTGCAG 
ACGCTGATCG AGATCGGCCC GAAGGCCTTG GCCGAGCCGC GCGACTATGC GACGCGCGCG 
AACCTGATGT GGGTCGCGAC GCTCGCGCTG AACGGCCTGA TCGGCGCGGG CGTGCCGCAG 
GACTGGGCGA CGCACATGGT CGGGCACGAG CTCACCGCGC GCTACGACAT CGACCATGCG 
CGCACGCTCG CCGTCGTGCT GCCGTCGATG CTCGACGCGC GCCGCGACGC GAAGCGCGCA 
AAGCTGCTGC AATACGCGGC GCGCGTCTGG AACATCGTCG ACGGCCCCGA GGACGCGCGC 
ATCGACGCGG CGATCGCGCG CACGCGCGCG TTCTTCGAAA GCCTCGGCGT GAAGACCCGC 
CTCGCCGATT ACGGCGTGGG CGCCGATGCG ATCGACGGCC TGATCGCGCA ACTCGAGGCG 
CACGGGATGA CGCGACTCGG CGAGCGCAAG GACGTCACGC TCGACGTGAG CCGCCGCGTG 
CTCGAGGCCA GCCTGTGA

Protein sequence

MLNFDFYNPT RIVFGEKTAA RLNDLLPAAA RVLVLYGGES ARSNGTLDEV RAALGARDVR 
EFGGIEPNPA YETLMRAVEL ARRERVDFLL AVGGGSVIDG TKFVAAAVPF EGDPWTILET 
HGANVAAALP FGCVLTLPAT GSEMNNGAVL TRRATRAKLA FRHPLVFPTF SILDPTKTYT 
LPPRQVANGV VDAFTHIVEQ YLTYPADGLA QDRFAEGLLQ TLIEIGPKAL AEPRDYATRA 
NLMWVATLAL NGLIGAGVPQ DWATHMVGHE LTARYDIDHA RTLAVVLPSM LDARRDAKRA 
KLLQYAARVW NIVDGPEDAR IDAAIARTRA FFESLGVKTR LADYGVGADA IDGLIAQLEA 
HGMTRLGERK DVTLDVSRRV LEASL