Gene BURPS1106A_1083 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_1083
Symbol
ID	4902649
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	1065183
End bp	1066622
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	73%
IMG OID	640134313
Product	aldehyde dehydrogenase (NAD) family protein
Protein accession	YP_001065363
Protein GI	126452887
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAGAAG CGAAGCACTT CATCGCGGGC GCATGGGCGC CGCCCGCGGG CGGCGAGACG 
ATCGCCGTGA TCGACCCGTC CGACGGCGAG CCGTTCGCGC GGCTCGCGCG CGGCACCGCG 
CCCGATGTCG GCGCGGCCGT GCAAGCGGCG CGCGCCGCGT TCGACGGCTC GTGGGGCGCG 
CTCGGCGCGG CCGACCGCGG GCGCATGCTG TACCGGCTGT CGATGCTCGT CGCCGCGTGC 
CGCGAGGAGC TCGCGCTCAT CGAATCGCGC GACACCGGCA AGCCGCTCAC GCAGGCGCGC 
GCGGACGCCG ACGCGCTCGC CCGCTACCTC GAGTTCTACG CGGGCGCGGC CGACAAGCTG 
CACGGCGAGA CGCTGCCCTA CCGCGACGGC TACACGGTAC TCACGCTGCG CGAGCCGCAC 
GGCGTGACGG GCCACATCGT GCCGTGGAAT TATCCGATGC AGATCCTCGG GCGCAGCGTC 
GGCGCGGCGC TCGCCGCGGG CAACGCGTGC GTCGTCAAGC CCTCGGAGGA CGCGTGCCTG 
TCGATCCTGC GCGTCGCCAC GCTCGCCGCC GAAGCCGGGC TGCCCGAGGG CGCGTTCAAC 
GTCGTGACGG GCTACGGCCA CGAAGCGGGC GCGGCGCTCG CGCGCCATCC CGGCGTCGAT 
CACCTGTCGT TCACCGGTTC GCCGGATACA GGCCGCCTCG TCGCGCAGAT GGCGGCCGAG 
CACCACGCGA GCGTCACGCT CGAGCTCGGC GGCAAGTCGC CGCAGATCGT GTTCGCCGAC 
GCGGATCTCG ACGCGGCATT GCCCGTCCTC GTGTCCGCGA TCGTCCAGAA CGCCGGCCAG 
ACCTGTTCGG CCGGCAGCCG CGTGCTGATC GACAAGGCGG TCTACGAGCC GCTCGTCGAG 
CGGCTCGCGA CCGCGTTCAA CGGGCTGAAG GTCGGCCCCG GCCGCGCCGA TCTCGATTGC 
GGGCCGCTCA TCAACGCGAA GCAGCAGCAG CGCGTGTGGG ACTTCCTCTC CGATGCGCAG 
CACGACGGCA TCACGATGGC CGCGCACGGC CAGGTCGTGC CGGACGCGCC CGAAACGGGC 
TTCTACCAGG CGCCCGCGCT GCTTCGCGAC GTGCCGCACA CGCACCGGCT CGCACAGGAG 
GAAGTGTTCG GGCCGGTGCT CGCCGCGATG CCGTTCGCCG ACGAGGACGA AGCGCTCGCG 
CTCGCGAACG GCACGCCGTT CGGGCTCGTC GCCGGCATCT GGACGCGCGA CGGCGCGCGG 
CAGATGCGGC TCGCACGCAA GGTGCGCGCG GGGCAGGTGT TCGTCAACAA CTACGGCGCG 
GGCGGCGGCG TCGAGTTGCC GTTCGGCGGT ACCGGGCGCT CGGGCTACGG CCGCGAGAAG 
GGCTTCGAGG CGCTGTACGG CTTCACCGTG CTGAAGACGA TCGCGCTGCG GCACGGCTGA

Protein sequence

MEEAKHFIAG AWAPPAGGET IAVIDPSDGE PFARLARGTA PDVGAAVQAA RAAFDGSWGA 
LGAADRGRML YRLSMLVAAC REELALIESR DTGKPLTQAR ADADALARYL EFYAGAADKL 
HGETLPYRDG YTVLTLREPH GVTGHIVPWN YPMQILGRSV GAALAAGNAC VVKPSEDACL 
SILRVATLAA EAGLPEGAFN VVTGYGHEAG AALARHPGVD HLSFTGSPDT GRLVAQMAAE 
HHASVTLELG GKSPQIVFAD ADLDAALPVL VSAIVQNAGQ TCSAGSRVLI DKAVYEPLVE 
RLATAFNGLK VGPGRADLDC GPLINAKQQQ RVWDFLSDAQ HDGITMAAHG QVVPDAPETG 
FYQAPALLRD VPHTHRLAQE EVFGPVLAAM PFADEDEALA LANGTPFGLV AGIWTRDGAR 
QMRLARKVRA GQVFVNNYGA GGGVELPFGG TGRSGYGREK GFEALYGFTV LKTIALRHG