Gene Mjls_1091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_1091
Symbol
ID	4876831
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	-
Start bp	1167789
End bp	1169309
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	68%
IMG OID	640138404
Product	methylmalonate-semialdehyde dehydrogenase [acylating]
Protein accession	YP_001069389
Protein GI	126433698
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01722] methylmalonic acid semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAACC AGATCCAGCA CTTCATCAAC GGCAAGCGCA CCGCAGGCGA GTCCACCCGC 
ACCGCGGACG TGATGAACCC GAGCACGGGG GCGGTGCAGG CCCAGGTCCT GCTCGGCTCG 
CGCGCCGACG TCGACGCCGC GGTGGCCGGC GCCGCCGAGG CTCAGAAGGA GTGGGCGGCG 
TGGAACCCGC AGCGCCGCGC CCGCGTCATG ATGCGCTTCA TCGAACTGGT CAACCAGCAC 
ATGGACGAGT TGGCCGAACT GCTGTCGATC GAACACGGCA AGACCGTCCC CGACGCCAAG 
GGCGATATCC AGCGCGGTAT CGAGGTCATC GAGTTCGCGA TCGGCATCCC CCACCTGATC 
AAGGGTGAGT ACACCGAGGG CGCGGGCACC GGCATCGACG TCTACTCGAT GCGCCAGCCG 
CTCGGCGTCG TCGCCGGCAT CACACCCTTC AACTTCCCGG CGATGATCCC GCTGTGGAAG 
GCCGGTCCCG CGCTGGCCTG CGGTAACGCC TTCATCCTCA AGCCGTCCGA GCGCGACCCC 
TCGGTGCCGG TGCGCCTGGC CGAATTGTTC ATCGAGGCCG GCCTGCCCGC GGGAGTGTTC 
CAGGTCGTGC ACGGCGACAA GGAAGCCGTC GACGCGATCC TCGAGCATCC GGTGATCCAG 
GCTGTCGGCT TCGTCGGCAG CTCCGACATC GCCCAGTACA TCTACGCCGG CGCGACAGCC 
AACGGTAAGC GCGCGCAGTG CTTCGGCGGC GCGAAGAACC ACATGATCGT GATGCCCGAC 
GCCGATCTCG ACCAGGCCGT CGACGCGCTG ATCGGCGCCG GCTACGGCAG CGCCGGCGAG 
CGCTGCATGG CGATCAGCGT GGCGGTACCC GTCGGCAAGG AGACCGCGGA CCGGCTGCGC 
AACCGGCTGG TCGAGCGGGT CAACAACCTG CGCGTCGGCC ACAGCCTCGA CCCGAAGGCC 
GATTACGGCC CACTGGTCAC CGAGGCCGCG CTCAACCGGG TCCGCGACTA CATCAACCAG 
GGCGTCGAGG CGGGCGCCGA GGCCGTCGTC GACGGGCGCG AGCGTTCCAG CGACGAGATG 
CAGTTCGGCG ACGACAGCCT CGAGGGCGGC TACTTCATCG GCCCCACGCT GTTCGACCAC 
GTCACCCCGG ACATGTCGAT CTACACCGAC GAGATCTTCG GCCCGGTGCT GTGCATCGTG 
CGCGCCGACA ACTACGAAGA GGCACTGCGC CTGCCCACCG AGCACGAGTA CGGCAACGGC 
GTGGCGATCT TCACCCGCGA CGGCGACACC GCACGCGACT TCGTCGCCAA GGTCCAGGTC 
GGCATGGTCG GGGTCAACGT CCCGATCCCG GTTCCGGTGT CGTACCACAC CTTCGGCGGC 
TGGAAGCGTT CCGGCTTCGG CGACCTCAAC CAGCACGGGC CGCACTCGAT CCTGTTCTAC 
ACCAAGACCA AGACCGTCAC GCAGCGCTGG CCGTCGGGCA TCAAGGATGG CGCCGAATTC 
GTCATCCCCA CGATGAAGTA G

Protein sequence

MTNQIQHFIN GKRTAGESTR TADVMNPSTG AVQAQVLLGS RADVDAAVAG AAEAQKEWAA 
WNPQRRARVM MRFIELVNQH MDELAELLSI EHGKTVPDAK GDIQRGIEVI EFAIGIPHLI 
KGEYTEGAGT GIDVYSMRQP LGVVAGITPF NFPAMIPLWK AGPALACGNA FILKPSERDP 
SVPVRLAELF IEAGLPAGVF QVVHGDKEAV DAILEHPVIQ AVGFVGSSDI AQYIYAGATA 
NGKRAQCFGG AKNHMIVMPD ADLDQAVDAL IGAGYGSAGE RCMAISVAVP VGKETADRLR 
NRLVERVNNL RVGHSLDPKA DYGPLVTEAA LNRVRDYINQ GVEAGAEAVV DGRERSSDEM 
QFGDDSLEGG YFIGPTLFDH VTPDMSIYTD EIFGPVLCIV RADNYEEALR LPTEHEYGNG 
VAIFTRDGDT ARDFVAKVQV GMVGVNVPIP VPVSYHTFGG WKRSGFGDLN QHGPHSILFY 
TKTKTVTQRW PSGIKDGAEF VIPTMK