Gene BCG9842_B3004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCG9842_B3004
Symbol	mmsA1
ID	7182116
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus G9842
Kingdom	Bacteria
Replicon accession	NC_011772
Strand	+
Start bp	2178664
End bp	2180124
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	38%
IMG OID	643550047
Product	methylmalonic acid semialdehyde dehydrogenase
Protein accession	YP_002445717
Protein GI	218897306
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01722] methylmalonic acid semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.18708
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTACAA CTGAAATTAA ACGAGTAAAA AATCACATTA ACGGTGAGTG GGTTGAATCG 
ACAGGTACGG AAGTAGAAGC AGTTCCAAAT CCAGCGACTG GAAAAATTAT CGCTTACGTT 
CCACTATCTC CAAAAGAAGA TGTTGAAAAA GCTGTTGAAG CGGCAAAAGC AGCATTTGAA 
ACGTGGTCTA AAGTACCAGT TCCGAATCGT TCAAGAAATT TATATAAATA TTTACAGCTA 
TTACAAGAAA ACAAAGATGA GCTTGCGAAA ATCATTACGC TAGAGAATGG TAAGACGCTA 
ACGGATGCAA CAGGTGAAGT ACAGCGTGGT ATTGAAGCAG TGGAACTTGC AACATCGGCA 
CCTAATTTAA TGATGGGTCA AGCGCTGCCG AATATTGCTA GTGGAATTGA TGGATCAATT 
TGGCGCTACC CAATCGGAGT TGTTGCTGGT ATTACGCCGT TTAACTTCCC AATGATGATT 
CCGTTATGGA TGTTCCCACT TGCAATTGCT TGCGGTAATA CATTCGTATT AAAAACATCG 
GAAAGAACGC CACTTTTAGC GGAGCGACTT GTAGAATTAT TCTATGAAGC AGGTTTCCCA 
AAAGGCGTAT TAAATTTAGT ACAAGGCGGA AAAGATGTTG TAAATAGCAT TTTAGAAAAT 
AAAGATATTC AAGCTGTTTC GTTCGTCGGT TCTGAGCCAG TAGCTCGTTA CGTATATGAA 
ACAGGTACGA AACACGGAAA ACGTGTACAA GCGTTAGCGG GTGCAAAAAA CCATGCGATT 
GTAATGCCAG ATTGCAATCT TGAGAAAACA GTACAAGGTG TAATTGGATC TGCATTTGCA 
AGTAGTGGAG AGCGCTGCAT GGCATGCTCA GTAGTAGCAG TAGTGGATGA AATTGCTGAT 
GAATTCATTG ATGTATTAGT AGCAGAAACG AAAAAATTAA AAGTAGGCGA TGGCTTTAAC 
GAAGATAACT ATGTTGGACC ATTAATTCGT GAATCTCATA AAGAGCGTGT TTTAGGCTAT 
ATTAGTAGTG GTGTAGCAGA TGGGGCAACT TTATTAGTAG ATGGCCGTAA AATTAATGAA 
GAAGTTGGAG AAGGTTATTT TGTAGGTGCG ACAATCTTTG ATGGCGTGAA TCAAGAAATG 
AAAATTTGGC AAGATGAAAT TTTTGCTCCA GTATTAAGCA TTGTACGTGT TAAAGATTTA 
GAAGAAGGTA TTAAACTAAC AAATCAATCT AAATTTGCAA ATGGTGCGGT TATTTATACG 
TCAAATGGTA AACATGCACA AACATTCCGT GATAACATCG ATGCTGGTAT GATTGGTGTA 
AATGTAAATG TTCCAGCACC AATGGCATTC TTCGCATTTG CAGGAAATAA AGCTTCATTC 
TTTGGTGATT TAGGTACAAA TGGTACAGAT GGCGTTCAAT TCTATACACG TAAAAAAGTT 
GTAACTGAGC GCTGGTTTTA A

Protein sequence

MITTEIKRVK NHINGEWVES TGTEVEAVPN PATGKIIAYV PLSPKEDVEK AVEAAKAAFE 
TWSKVPVPNR SRNLYKYLQL LQENKDELAK IITLENGKTL TDATGEVQRG IEAVELATSA 
PNLMMGQALP NIASGIDGSI WRYPIGVVAG ITPFNFPMMI PLWMFPLAIA CGNTFVLKTS 
ERTPLLAERL VELFYEAGFP KGVLNLVQGG KDVVNSILEN KDIQAVSFVG SEPVARYVYE 
TGTKHGKRVQ ALAGAKNHAI VMPDCNLEKT VQGVIGSAFA SSGERCMACS VVAVVDEIAD 
EFIDVLVAET KKLKVGDGFN EDNYVGPLIR ESHKERVLGY ISSGVADGAT LLVDGRKINE 
EVGEGYFVGA TIFDGVNQEM KIWQDEIFAP VLSIVRVKDL EEGIKLTNQS KFANGAVIYT 
SNGKHAQTFR DNIDAGMIGV NVNVPAPMAF FAFAGNKASF FGDLGTNGTD GVQFYTRKKV 
VTERWF