Gene BURPS668_1077 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_1077
Symbol
ID	4883998
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	1056221
End bp	1057660
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	73%
IMG OID	640127005
Product	NAD-dependent aldehyde dehydrogenases
Protein accession	YP_001058127
Protein GI	126440732
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAGAAG CGAAGCACTT CATCGCGGGC GCATGGGCGC CGCCCGCGGG CGGCGAGACG 
ATCGCCGTGA TCGACCCGTC CGACGGCGAG CCGTTCGCGC GGCTCGCGCG CGGCACCGCG 
CCCGATGTCG GCGCGGCCGT GCAAGCGGCG CGCGCCGCGT TCGACGGCCC GTGGGGCGCG 
CTCGGCGCGG CCGACCGCGG GCGCATGCTG TACCGGCTGT CGATGCTCGT CGCCGCGTGC 
CGCGAGGAGC TCGCGCTCAT CGAATCGCGC GACACCGGCA AGCCGCTCAC GCAGGCGCGC 
GCGGACGCCG ACGCGCTCGC CCGCTACCTC GAGTTCTACG CGGGCGCGGC CGACAAGCTG 
CACGGCGAGA CGCTGCCCTA CCGCGACGGC TACACGGTAC TCACGCTGCG CGAGCCGCAC 
GGCGTGACGG GCCACATCGT GCCGTGGAAT TACCCGATGC AGATCCTCGG GCGCAGCGTC 
GGCGCGGCGC TCGCCGCGGG CAACGCGTGC GTCGTCAAGC CCTCGGAGGA CGCGTGCCTG 
TCGATCCTGC GCGTCGCCAC GCTCGCCGCC GAAGCCGGGC TGCCCGAGGG CGCGTTCAAC 
GTCGTGACGG GCTACGGCCA CGAAGCGGGC GCGGCGCTCG CGCGCCATCC CGGCGTCGAT 
CACCTGTCGT TCACCGGTTC GCCGGATACA GGCCGCCTCG TCGCGCAGAT GGCGGCCGAG 
CACCACGCGA GCGTCACGCT CGAGCTCGGC GGCAAGTCGC CGCAGATCGT GTTCGCCGAC 
GCGGACCTCG ACGCGGCATT GCCCGTCCTC GTGTCCGCGA TCGTCCAGAA CGCCGGCCAG 
ACCTGTTCGG CCGGCAGCCG CGTGCTGATC GACAAGGCGG TCTACGAGCC GCTCGTCGAG 
CGGCTCGCGA CCGCGTTCAA CGGGCTGAAG GTCGGCCCCG GCCGCGCCGA TCTCGATTGC 
GGGCCGCTCA TCAACGCGAA GCAGCAGCAG CGCGTGTGGG ACTTCCTCTC CGATGCGCAG 
CACGACGGCA TCGCGATGGC CGCGCACGGC CACGTCGTGC CGGACGCGCC CGAAACGGGC 
TTCTACCAGG CGCCCGCGCT GCTTCGCGAC GTGCCGCACA CGCACCGGCT CGCACAGGAG 
GAAGTGTTCG GGCCGGTGCT CGCCGCGATG CCGTTCGCCG ACGAGGACGA AGCGCTCGCG 
CTCGCGAACG GCACGCCGTT CGGGCTCGTC GCCGGCATCT GGACGCGCGA CGGCGCGCGG 
CAGATGCGGC TCGCGCGCAA GGTGCGCGCG GGGCAGGTGT TCGTCAACAA CTACGGCGCG 
GGCGGCGGCG TCGAGTTGCC GTTCGGCGGT ACCGGGCGCT CGGGCTACGG CCGCGAGAAG 
GGCTTCGAGG CGCTGTACGG CTTCACCGTG CTGAAGACGA TCGCGCTGCG GCACGGCTGA

Protein sequence

MEEAKHFIAG AWAPPAGGET IAVIDPSDGE PFARLARGTA PDVGAAVQAA RAAFDGPWGA 
LGAADRGRML YRLSMLVAAC REELALIESR DTGKPLTQAR ADADALARYL EFYAGAADKL 
HGETLPYRDG YTVLTLREPH GVTGHIVPWN YPMQILGRSV GAALAAGNAC VVKPSEDACL 
SILRVATLAA EAGLPEGAFN VVTGYGHEAG AALARHPGVD HLSFTGSPDT GRLVAQMAAE 
HHASVTLELG GKSPQIVFAD ADLDAALPVL VSAIVQNAGQ TCSAGSRVLI DKAVYEPLVE 
RLATAFNGLK VGPGRADLDC GPLINAKQQQ RVWDFLSDAQ HDGIAMAAHG HVVPDAPETG 
FYQAPALLRD VPHTHRLAQE EVFGPVLAAM PFADEDEALA LANGTPFGLV AGIWTRDGAR 
QMRLARKVRA GQVFVNNYGA GGGVELPFGG TGRSGYGREK GFEALYGFTV LKTIALRHG