Gene BURPS1106A_A1836 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A1836
Symbol	betB
ID	4906271
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	1803626
End bp	1805095
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	67%
IMG OID	640144942
Product	betaine aldehyde dehydrogenase
Protein accession	YP_001075870
Protein GI	126455859
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01804] glycine betaine aldehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.422897
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGTAT ACGGTCTGCA GCGCCTTTAC ATCGCCGGCG CCCACGCCGA CGCCACGAGC 
GGCAAGACGT TCGATACGTT CGATCCCGCG ACGGGCGAAT TGCTCGCGCG CGTTCAGCAG 
GCGAGCGCCG ACGATGTCGA CCGCGCGGTC GCATCCGCGC GCGAAGGCCA GCGCGAATGG 
GCCGCGATGA CCGCGATGCA GCGCTCGCGC ATCCTGCGTC GCGCGGTCGA ATTGCTGCGC 
GAGCGCAACG ACGCGCTCGC CGAGCTCGAG ATGCGCGACA CGGGCAAGCC GATCGCGGAA 
ACGCGCGCCG TCGACATCGT CACGGGCGCC GACGTGATCG AGTACTACGC GGGCCTCGCG 
ACCGCGATCG AAGGTCTGCA AGTGCCGCTG CGCCCGGAAT CGTTCGTCTA CACGCGGCGC 
GAGCCGCTCG GCGTGTGCGC GGGCATCGGC GCATGGAACT ACCCGATCCA GATCGCCTGC 
TGGAAGAGCG CGCCCGCGCT CGCCGCCGGC AACGCGATGA TCTTCAAGCC GAGCGAAGTC 
ACGCCGCTGT CCGCGCTCAA GCTCGCGGAG ATCTACACCG AGGCGGGAGT GCCCGCCGGC 
GTGTTCAACG TCGTGCAGGG CGACGGCTCG GTCGGCGCGC TGCTCAGCGC GCACCCGGGC 
ATCGCGAAGG TGTCGTTTAC GGGCGGCGTC GAAACCGGCA AGAAGGTGAT GTCGCTCGCG 
GGCGCATCGT CGCTGAAGGA AGTGACGATG GAACTGGGCG GCAAATCGCC GCTCATCGTG 
TTCGACGACG CCGATCTCGA CCGCGCGGCC GACATCGCCG TCACCGCGAA CTTCTTCAGC 
GCGGGCCAGG TGTGCACGAA CGGCACGCGC GTGTTCGTCC AGCAAGCGGT GAAGGACGCG 
TTCGTCGAGC GCGTGCTCGC GCGCGTCGCA CGGATTCGGG TCGGCAAACC TTCGGATTCC 
GACACGAATT TCGGACCGCT CGCGAGCGCC GCCCAGCTCG ACAAGGTGCT CGGCTACATC 
GACAGCGGCA AGGCCGAAGG CGCGAAGCTG CTCGCGGGCG GCGCGCGCCT CGTGAACGAT 
CACTTCGCGA GCGGCCAGTA CGTTGCGCCG ACCGTGTTCG GCGATTGCCG CGACGACATG 
AGGATCGTCC GCGAAGAGAT TTTCGGGCCG GTGATGAGCA TCCTGTCGTT CGAAACGGAA 
GACGAAGCGA TCGCGCGCGC GAACGCGACC GACTACGGCC TCGCGGCGGG CGTCGTCACC 
GAGAACCTGT CGCGCGCGCA CCGCGCGATC CATCGCCTCG AAGCCGGCAT CTGCTGGATC 
AACACGTGGG GCGAATCGCC CGCCGAGATG CCGGTTGGCG GGTATAAGCA ATCCGGCGTC 
GGACGCGAGA ACGGCATCAC GACGCTCGAG CACTACACTC GAATCAAATC GGTGCAGGTC 
GAGCTCGGCC GCTATCAACC GGTGTTCTAA

Protein sequence

MSVYGLQRLY IAGAHADATS GKTFDTFDPA TGELLARVQQ ASADDVDRAV ASAREGQREW 
AAMTAMQRSR ILRRAVELLR ERNDALAELE MRDTGKPIAE TRAVDIVTGA DVIEYYAGLA 
TAIEGLQVPL RPESFVYTRR EPLGVCAGIG AWNYPIQIAC WKSAPALAAG NAMIFKPSEV 
TPLSALKLAE IYTEAGVPAG VFNVVQGDGS VGALLSAHPG IAKVSFTGGV ETGKKVMSLA 
GASSLKEVTM ELGGKSPLIV FDDADLDRAA DIAVTANFFS AGQVCTNGTR VFVQQAVKDA 
FVERVLARVA RIRVGKPSDS DTNFGPLASA AQLDKVLGYI DSGKAEGAKL LAGGARLVND 
HFASGQYVAP TVFGDCRDDM RIVREEIFGP VMSILSFETE DEAIARANAT DYGLAAGVVT 
ENLSRAHRAI HRLEAGICWI NTWGESPAEM PVGGYKQSGV GRENGITTLE HYTRIKSVQV 
ELGRYQPVF