Gene BURPS668_2129 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_2129
Symbol
ID	4883336
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	2120292
End bp	2121728
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	69%
IMG OID	640128057
Product	aldehyde dehydrogenase (NAD) family protein
Protein accession	YP_001059164
Protein GI	126441896
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAACCT GCGAACAGTT CTACATCGGC GGTGCATGGC GCCCGAGCAC GGGCAAGGGC 
ATGATCGACG TGATCGACTC CGGCACCGAG GCCGTGATCG GCCGCGTCCC CGAAGGCACC 
GCCGAAGACG CGAAAGCGGC CGTCGCGGCC GCGCGCGCGG CGTTCGACGG CTGGGCCGCG 
ACGCCGCCCG CCGAGCGCGC CCGCTATCTG CAGCAGATCG CCGAGAACCT GAAGGCGCGC 
AGCGAGGAGC TCGCGCAATC GATCACGGGC GAAGTCGGCA TGCCGATCAA GCTGTCGCGC 
GCGATCCAGG TCGGCGGGCC GATCTACAAC TGGGGCGCGT ATGCGAAACT CGCCGAGACC 
TTCGCGTTCG AGGAGCAGGT GGGCAATTCG CTCGTCGTGC GCGAGCCTGT CGGCGTCGTC 
GCGGCGATCA CGCCCTGGAA CTATCCGCTC AACCAGATCA CGCTGAAGGT CGCGGCCGCG 
CTCGCGGCGG GCTGCACGGT CGCGCTGAAG CCGTCCGAGG TCGCACCGCT CAATGCGTTC 
ATCCTCGCCG AGGCGATTCA CGACGCGGGG CTGCCCGTCG GCGTGTTCAA TCTCGTGTGC 
GGCTACGGGC CCGTCGTCGG CGAGGCGCTC GCGAGCGACG CCGATGTCGA CATGGTGTCG 
TTCACCGGCT CGACGCGCGC GGGCAAGCGC GTCGCCGAGC TCGCCGCGGC CGGCGTGAAG 
CGCGTCGCGC TCGAACTGGG CGGCAAATCG GCGTCGGTGA TTCTCGACGA CGCCGATTTC 
GCGGCCGCGG TGAAGGGCAC GGTGTCCGCT TGCTATCTGA ACGCCGGGCA GACGTGCTCC 
GCGCATACGC GCATGCTCGT GCCCGAATCG CGCTACGAGG AGGCGCGCGA CCTCGCGAAG 
GCCGCCGCGC AAGCCTATGT CGCGGGCGAT CCGCGCGACG ACGCGACGCG GCTCGGCGCG 
CTCGCGTCGT CGGTCCAGCA AAAGCGCGTG CAGGATTACA TCCGGCGCGG CATCGACGAA 
GGCGCGGAGC TCGTCACGGG CGGCCTCGGC ATGCCGGAGG GCATCACGCG CGGCTTCTTC 
GTGAAGCCGA CCGTGTTCGG GCGCGTGAAG CCCGACGCGA CGATCGCCCA GGAGGAGATC 
TTCGGCCCGG TGCTGTCGAT TCTCACGTAT CGCGACGAGG ATGACGCGGT GCGCATCGCG 
AACGATTCGC CGTACGGGCT CGGCGGCGCG GTGTGGGCGG GCAGCGATGA GCGCGCGATG 
CGCGTCGCGC GCCGCATCCG CACGGGGCAG GTCGACATCA ACGGCGGGGC ATGGAACATG 
GCCGCGCCGT TCGGCGGTTT CAAACAGTCG GGCATCGGCC GCGAGAACGG CGTGTACGGT 
CTCGACGAAT ATCTCGAATA CAAATCGATG CAATTGCGCC CGCACAAGCG CGCGTGA

Protein sequence

MKTCEQFYIG GAWRPSTGKG MIDVIDSGTE AVIGRVPEGT AEDAKAAVAA ARAAFDGWAA 
TPPAERARYL QQIAENLKAR SEELAQSITG EVGMPIKLSR AIQVGGPIYN WGAYAKLAET 
FAFEEQVGNS LVVREPVGVV AAITPWNYPL NQITLKVAAA LAAGCTVALK PSEVAPLNAF 
ILAEAIHDAG LPVGVFNLVC GYGPVVGEAL ASDADVDMVS FTGSTRAGKR VAELAAAGVK 
RVALELGGKS ASVILDDADF AAAVKGTVSA CYLNAGQTCS AHTRMLVPES RYEEARDLAK 
AAAQAYVAGD PRDDATRLGA LASSVQQKRV QDYIRRGIDE GAELVTGGLG MPEGITRGFF 
VKPTVFGRVK PDATIAQEEI FGPVLSILTY RDEDDAVRIA NDSPYGLGGA VWAGSDERAM 
RVARRIRTGQ VDINGGAWNM AAPFGGFKQS GIGRENGVYG LDEYLEYKSM QLRPHKRA