Gene BMASAVP1_0467 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMASAVP1_0467
Symbol	betB
ID	4678447
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei SAVP1
Kingdom	Bacteria
Replicon accession	NC_008784
Strand	+
Start bp	474721
End bp	476190
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	68%
IMG OID	639842994
Product	betaine aldehyde dehydrogenase
Protein accession	YP_990077
Protein GI	121597411
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01804] glycine betaine aldehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGTAT ACGGTCTGCA GCGCCTTTAC ATCGCCGGCG CCCACGCCGA CGCCACGAGC 
GGCAAGACGT TCGATACGTT CGATCCCGCG ACGGGCGAAT TGCTCGCGCG CGTTCAGCAG 
GCGAGCGCCG ACGATGTCGA CCGCGCGGTC GCATCCGCGC GCGAAGGCCA GCGCGAATGG 
GCCGCGATGA CCGCGATGCA GCGCTCGCGC ATCCTGCGTC GCGCGGTCGA ATTGCTGCGC 
GAGCGCAACG ACGCGCTCGC CGAGCTCGAG ATGCGCGACA CGGGCAAGCC GATCGCGGAA 
ACGCGCGCCG TCGATATCGT CACGGGCGCC GACGTGATCG AGTACTACGC GGGCCTCGCG 
ACCGCGATCG AAGGTCTGCA GGTGCCGCTG CGCCCGGAAT CGTTCGTCTA CACGCGGCGC 
GAGCCGCTCG GCGTGTGCGC GGGCATCGGC GCATGGAACT ACCCGATCCA GATCGCCTGC 
TGGAAGAGCG CGCCCGCGCT CGCCGCCGGC AACGCGATGA TCTTCAAGCC GAGCGAAGTC 
ACGCCGCTGT CCGCGCTCAA GCTCGCGGAG ATCTACACCG AGGCGGGAGT GCCCGCCGGC 
GTGTTCAACG TCGTGCAGGG CGACGGCTCG GTCGGCGCGC TGCTCAGCGC GCACCCGGGC 
ATCGCGAAGG TGTCGTTTAC GGGCGGCGTC GAAACCGGCA AGAAGGTGAT GTCGCTCGCG 
GGCGCATCGT CGCTGAAGGA AGTGACGATG GAACTGGGCG GCAAATCGCC GCTCATCGTG 
TTCGACGACG CCGATCTCGA CCGCGCGGCC GACATCGCCG TCACCGCGAA CTTCTTCAGC 
GCGGGCCAGG TGTGCACGAA CGGCACGCGC GTGTTCGTCC AGCAAGCGGT GAAGGACGCG 
TTCGTCGAGC GCGTGCTCGC GCGCGTCGCA CGGATTCGGG CCGGCAAACC TTCGGATCCC 
GACACGAATT TCGGACCGCT CGCGAGCGCC GCCCAGCTCG ACAAGGTGCT CGGCTACATC 
GACAGCGGCA AGGCCGAAGG CGCGAAGCTG CTCGCGGGCG GCGCGCGCCT CGTGAACGAT 
CACTTCGCGA GCGGCCAGTA CGTTGCGCCG ACCGTGTTCG GCGATTGCCG CGACGACATG 
AGGATCGTCC GCGAAGAGAT TTTCGGGCCG GTGATGAGCA TCCTGTCGTT CGAAACGGAA 
GACGAAGCGA TCGCGCGCGC GAACGCGACC GACTACGGCC TCGCGGCGGG CGTCGTCACC 
GAGAACCTGT CGCGCGCGCA CCGCGCGATC CATCGCCTCG AAGCCGGCAT CTGCTGGATC 
AACACGTGGG GCGAATCGCC CGCCGAGATG CCGGTTGGCG GGTATAAGCA ATCCGGCGTC 
GGACGCGAGA ACGGCATCAC GACGCTCGAG CACTACACTC GAATCAAATC GGTGCAGGTC 
GAGCTCGGCC GCTATCAACC GGTGTTCTAA

Protein sequence

MSVYGLQRLY IAGAHADATS GKTFDTFDPA TGELLARVQQ ASADDVDRAV ASAREGQREW 
AAMTAMQRSR ILRRAVELLR ERNDALAELE MRDTGKPIAE TRAVDIVTGA DVIEYYAGLA 
TAIEGLQVPL RPESFVYTRR EPLGVCAGIG AWNYPIQIAC WKSAPALAAG NAMIFKPSEV 
TPLSALKLAE IYTEAGVPAG VFNVVQGDGS VGALLSAHPG IAKVSFTGGV ETGKKVMSLA 
GASSLKEVTM ELGGKSPLIV FDDADLDRAA DIAVTANFFS AGQVCTNGTR VFVQQAVKDA 
FVERVLARVA RIRAGKPSDP DTNFGPLASA AQLDKVLGYI DSGKAEGAKL LAGGARLVND 
HFASGQYVAP TVFGDCRDDM RIVREEIFGP VMSILSFETE DEAIARANAT DYGLAAGVVT 
ENLSRAHRAI HRLEAGICWI NTWGESPAEM PVGGYKQSGV GRENGITTLE HYTRIKSVQV 
ELGRYQPVF