Gene Bcep18194_A5054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcep18194_A5054
Symbol
ID	3750262
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia sp. 383
Kingdom	Bacteria
Replicon accession	NC_007510
Strand	-
Start bp	2091369
End bp	2092805
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	68%
IMG OID	637763350
Product	aldehyde dehydrogenase
Protein accession	YP_369292
Protein GI	78066523
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATCT ACGACCAGTT CTATATCGAC GGCGCGTGGC GCAAACCGGC CGGCACCGGC 
ACGATCGACG TGATCGACTC GGGCACCGAA GCCGTGATCG GGCGGATTCC GGAAGGCGTC 
GCATCCGACG CGCAGGACGC GATCCGCGCG GCGCGCGCAG CCTTCGACGC CTGGGCGGCC 
ACGCCGCCCG CGACGCGCGC GGGCTACCTG CGCAAGATCG TCGAGCATCT GCTGGCGCGC 
AGCGAGGAAC TCGCGCAGTC GATCACCGGC GAAGTCGGGA TGCCGATCAA GCTGTCGCGC 
GCGATCCAGG TCGGCGGCCC GATCTACAAC TGGAAGGCGT ACGCGAAGCT CGCCGAGTCG 
TTCGAGTTCG AGGCACAGGT CGGCAACTCG CTCGTCGTGC GCGAGCCGGT CGGTGTCGTC 
GCGGCAATCA CGCCGTGGAA CTACCCGCTC AACCAGGTCA CGCTGAAGGT CGCACCGGCA 
CTGGCGGCCG GCTGCACGGT CGTCCTGAAG CCGTCCGAAG TCGCGCCGCT GAACGCGTTC 
ATGCTCGCTG AAGCGATTCA CGAAGCCGGG CTGCCGGCCG GCGTGTTCAA CCTCGTGTGC 
GGCTACGGCC CGGTGGTCGG CGAGGTGCTG GCCACCGATC CGGACGTCGA CATGGTGTCG 
TTTACGGGCT CGACGCGCGC CGGCAAGCGC GTGGCCGAGC TGGCCGCCGC GGGCGTCAAG 
CGCGTCGCGC TCGAACTGGG CGGCAAGTCG GCGTCGGTGA TTCTCGACGA TGCCGATTTC 
GCGACGGCGG TGAAGGGCAC GGTCAACGCG TGCTACCTGA ACGCGGGGCA GACCTGCTCG 
GCACACACGC GCATGCTGGT GCCGGAAGCG CGCTACGACG AGGCGCGCGC GATCGCGAAG 
GCGGCGGCCG AAACCTACGT CGCCGGCGAT CCGCGGCAGG ATGCGACGCG CCTCGGCGCG 
CTGGCATCGG CCGTCCAGCA GCAGCGTGTG CAGGACTACA TCCAGCGCGG GATCGACGAA 
GGCGCGGAAC TCGTGACGGG TGGCACGGGC CTGCCGGAAG GGCTGGATAA AGGCTTCTTC 
GTGAAGCCGA CCGTGTTCGG CCGCGTCGAT CCGAAATCGA CGATCGCGCA AGAGGAAATC 
TTCGGGCCGG TGCTGTCGAT CATCACGTAT CGCGATGAAG ACGAGGCTGT GCGGATCGCG 
AACGATTCGC CGTACGGGCT CGGCGGCGCG GTGTGGGCCG GCAGCGACGA ACGCGCGATG 
GGCATCGCGC GCCGCATCCG CACCGGACAG GTCGACATCA ACGGCGGCGC GTGGAACATG 
GCCGCGCCGT TCGGCGGCTA CAAGCAATCG GGTCACGGCC GCGAGAACGG CGTGTACGGG 
CTCGAAGAAT ATCTCGAGTA CAAGTCGATG CAGCTCAAGC CCGCGAAGCC GGCCTGA

Protein sequence

MKIYDQFYID GAWRKPAGTG TIDVIDSGTE AVIGRIPEGV ASDAQDAIRA ARAAFDAWAA 
TPPATRAGYL RKIVEHLLAR SEELAQSITG EVGMPIKLSR AIQVGGPIYN WKAYAKLAES 
FEFEAQVGNS LVVREPVGVV AAITPWNYPL NQVTLKVAPA LAAGCTVVLK PSEVAPLNAF 
MLAEAIHEAG LPAGVFNLVC GYGPVVGEVL ATDPDVDMVS FTGSTRAGKR VAELAAAGVK 
RVALELGGKS ASVILDDADF ATAVKGTVNA CYLNAGQTCS AHTRMLVPEA RYDEARAIAK 
AAAETYVAGD PRQDATRLGA LASAVQQQRV QDYIQRGIDE GAELVTGGTG LPEGLDKGFF 
VKPTVFGRVD PKSTIAQEEI FGPVLSIITY RDEDEAVRIA NDSPYGLGGA VWAGSDERAM 
GIARRIRTGQ VDINGGAWNM AAPFGGYKQS GHGRENGVYG LEEYLEYKSM QLKPAKPA