Gene BURPS1106A_2184 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2184
Symbol
ID	4900129
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	2169701
End bp	2171137
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	69%
IMG OID	640135413
Product	aldehyde dehydrogenase (NAD) family protein
Protein accession	YP_001066448
Protein GI	126452549
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAACCT GCGAACAGTT CTACATCGGC GGTGCATGGC GCCCGAGCAC GGGCAAGGGC 
ATGATCGACG TGATCGACTC CGGCACCGAG GCCGTGATCG GCCGCGTCCC CGAAGGCACC 
GCCGAAGACG CGAAAGCGGC CGTCGCGGCC GCGCGCGCGG CGTTCGACGG CTGGGCCGCG 
ACGCCGCCCG CCGAGCGCGC CCGCTATCTG CACAAGATCA CCGAGAACCT GAAGGCGCGC 
AGCGAGGAGC TCGCGCAATC GATCACGGGC GAAGTCGGCA TGCCGATCAA GCTGTCGCGC 
GCGATCCAGG TCGGCGGGCC GATCTACAAC TGGGGCGCGT ATGCGAAACT CGCCGAGACC 
TTCGCGTTCG AGGAGCAGGT GGGCAATTCG CTCGTCGTGC GCGAGCCTGT CGGCGTCGTC 
GCGGCGATCA CGCCCTGGAA CTATCCGCTC AACCAGATCA CGCTGAAGGT CGCGGCCGCG 
CTCGCGGCGG GCTGCACGGT CGCGCTGAAG CCGTCCGAGG TCGCACCGCT CAATGCGTTC 
ATCCTCGCCG AGGCGATTCA CGACGCGGGG CTGCCCGCCG GCGTGTTCAA TCTCGTGTGC 
GGCTACGGGC CCGTCGTCGG CGAGGCGCTC GCGAGCGACG CCGATGTCGA CATGGTGTCG 
TTCACCGGCT CGACGCGCGC GGGCAAGCGC GTCGCCGAGC TCGCCGCGGC CGGCGTGAAG 
CGCGTCGCGC TCGAACTGGG CGGCAAATCG GCGTCGGTGA TTCTCGACGA CGCCGATTTC 
GCGGCCGCGG TGAAGGGCAC GGTGTCCGCG TGCTATCTGA ACGCCGGGCA GACGTGTTCC 
GCGCATACGC GCATGCTCGT GCCCGAATCG CGCTACGAGG AGGCGCGCGA CCTCGCGAAG 
GCCGCCGCGC AAGCCTATGT CGCGGGCGAT CCGCGCGACG ACGCGACGCG GCTCGGCGCG 
CTCGCGTCGT CGGTCCAGCA AAAGCGCGTG CAGGATTACA TCCGGCGCGG CATCGACGAA 
GGCGCGGAGC TCGTCACGGG CGGCCTCGGC ATGCCGGAGG GCATCACGCG CGGCTTCTTC 
GTGAAGCCGA CCGTGTTCGG GCGCGTGAAG CCCGACGCGA CGATCGCGCA GGAGGAGATC 
TTCGGCCCGG TGCTGTCGAT TCTCACGTAT CGCGACGAGG ATGACGCGGT GCGCATCGCG 
AACGATTCGC CGTACGGGCT CGGCGGCGCG GTGTGGGCGG GCAGCGACGA GCGCGCGATG 
CGCGTCGCGC GCCGCATCCG CACGGGGCAG GTCGATATCA ACGGCGGGGC ATGGAACATG 
GCCGCGCCGT TCGGCGGTTT CAAACAGTCG GGCATCGGCC GCGAGAACGG CGTGTACGGC 
CTCGACGAAT ATCTCGAATA CAAATCGATG CAATTGCGCC CGCACAAGCG CGCGTGA

Protein sequence

MKTCEQFYIG GAWRPSTGKG MIDVIDSGTE AVIGRVPEGT AEDAKAAVAA ARAAFDGWAA 
TPPAERARYL HKITENLKAR SEELAQSITG EVGMPIKLSR AIQVGGPIYN WGAYAKLAET 
FAFEEQVGNS LVVREPVGVV AAITPWNYPL NQITLKVAAA LAAGCTVALK PSEVAPLNAF 
ILAEAIHDAG LPAGVFNLVC GYGPVVGEAL ASDADVDMVS FTGSTRAGKR VAELAAAGVK 
RVALELGGKS ASVILDDADF AAAVKGTVSA CYLNAGQTCS AHTRMLVPES RYEEARDLAK 
AAAQAYVAGD PRDDATRLGA LASSVQQKRV QDYIRRGIDE GAELVTGGLG MPEGITRGFF 
VKPTVFGRVK PDATIAQEEI FGPVLSILTY RDEDDAVRIA NDSPYGLGGA VWAGSDERAM 
RVARRIRTGQ VDINGGAWNM AAPFGGFKQS GIGRENGVYG LDEYLEYKSM QLRPHKRA