Gene BURPS1106A_4070 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_4070
Symbol	mmsA
ID	4902279
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	3975717
End bp	3977243
Gene Length	1527 bp
Protein Length	508 aa
Translation table	11
GC content	69%
IMG OID	640137296
Product	methylmalonate-semialdehyde dehydrogenase
Protein accession	YP_001068289
Protein GI	126452315
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01722] methylmalonic acid semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGGCA GCACCCATTC GAACGATTCG CGCGTGCGCG CACTGGCCCA TTTCATCGGC 
GGGCGCGCGC TCGACGGCGC GAGCGACCGT TACGGCGACG TGTTCGATCC GGCCCTCGGC 
ACGGTGACGG CGCGCGTGCC GCTCGCGAGC GGCGCGGAAG TCGATGCGGC CGTCGCCGCC 
GCGGCCGCCG CGTTCCCCGC GTGGAGCGAG ACCTCGCCGC TCAAGCGCGC GCGCGTGATG 
TTCAAGTTCA AGGAGCTGCT CGACCGCCAT CACGACGAGC TCGCCGAGCT GATCACCCGC 
GAGCACGGCA AGGTGTTCTC GGATGCGAAG GGCGAGGTGA TGCGCGGAAT CGAGGTGGTC 
GAATTCGCGT GCGGCATTCC GAATCTGCTG AAGACCGACT TCACCGACCA GATCGGCGGC 
GGCATCGACA ACTGGAACCT GCGGCAGCCG CTTGGCGTCG TCGCCGGCAT CACGCCGTTC 
AATTTTCCGA TGATGGTGCC GTGCTGGATG TTTCCGGTGG CGATCGCGTG CGGCAACACG 
TTCGTGCTCA AGCCTTCCGA GCGCGATCCG TCGGCGTCGA TCCGGCTCGC CGAGCTGCTG 
AAGGAAGCGG GGCTGCCCGA CGGCGTGTTC AACGTCGTGC ACGGCGACAA GACGGCCGTC 
GACGCGCTGA TCGCGCATCC GGACGTGGCC GCGCTGTCGT TCGTCGGCTC GACGCCGATC 
GCCGAGTACA TTCACACGCA AGCCGCGCGC CGCGGCAAGC GCGTGCAGGC GCTCGGCGGC 
GCGAAGAACC ATCTCGTCGT GATGCCGGAC GCGAACCTCG ATCAGGCAGT GGACGCGCTC 
GTCGGCGCCG CGTACGGCTC GGCGGGCGAG CGCTGCATGG CGATTTCCGT CGCGGTCGCG 
GTGGGCGGCG TCGCCGACGC GCTCGTCGAG CGGCTCGCCG AGCGTGCGAA GGCGCTGAAG 
ATCGGCAACG GGATGAACGC CGACGTCGAA ATGGGGCCGC TCGTGACGGC CGCGCATCGC 
GCGAAGGTGT CCGCGTACAT CGACGCCGGC GTCGCGGCGG GCGCGAAGCT CGTCGTCGAC 
GGGCGCCGGC ACGTCGTCGC CGGCGGCGAG AACGGCTTCT TCCTCGGCGG CACGCTGTTC 
GACGACGTGA CGACCGACAT GTCGATCTAT CGCGAGGAAA TCTTCGGGCC GGTGCTGGCC 
GTCGTGCGGG TGCCGGATTT CGCGAGCGCG GTCGAGCTCA TCAACGCGCA CGAGTTCGCC 
AACGGCGTGT CGTGCTTCAC GTCCGACGGC GGCATCGCGC GCGCGTTCGC GCGGAAGATC 
CAGGTCGGGA TGGTGGGCAT CAACGTGCCG ATCCCGGTGC CGATGGCGTG GCATTCGTTC 
GGCGGCTGGA AGCGCTCGCT GTTCGGCGAT CACCACGCAT ACGGCGAGGA GGGCGTGCGT 
TTCTACACGC GCTACAAGAG CGTGATGCAG CGCTGGCCGG ACAGCATCGC GAAGGGCGCG 
GAGTTCACGA TGCCTGTCGC GAAGTGA

Protein sequence

MTGSTHSNDS RVRALAHFIG GRALDGASDR YGDVFDPALG TVTARVPLAS GAEVDAAVAA 
AAAAFPAWSE TSPLKRARVM FKFKELLDRH HDELAELITR EHGKVFSDAK GEVMRGIEVV 
EFACGIPNLL KTDFTDQIGG GIDNWNLRQP LGVVAGITPF NFPMMVPCWM FPVAIACGNT 
FVLKPSERDP SASIRLAELL KEAGLPDGVF NVVHGDKTAV DALIAHPDVA ALSFVGSTPI 
AEYIHTQAAR RGKRVQALGG AKNHLVVMPD ANLDQAVDAL VGAAYGSAGE RCMAISVAVA 
VGGVADALVE RLAERAKALK IGNGMNADVE MGPLVTAAHR AKVSAYIDAG VAAGAKLVVD 
GRRHVVAGGE NGFFLGGTLF DDVTTDMSIY REEIFGPVLA VVRVPDFASA VELINAHEFA 
NGVSCFTSDG GIARAFARKI QVGMVGINVP IPVPMAWHSF GGWKRSLFGD HHAYGEEGVR 
FYTRYKSVMQ RWPDSIAKGA EFTMPVAK