Gene Mflv_5010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mflv_5010
Symbol
ID	4976321
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium gilvum PYR-GCK
Kingdom	Bacteria
Replicon accession	NC_009338
Strand	+
Start bp	5335188
End bp	5336708
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	68%
IMG OID	640459237
Product	methylmalonate-semialdehyde dehydrogenase
Protein accession	YP_001136264
Protein GI	145225586
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01722] methylmalonic acid semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.352611
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACAC GCATCCCCCA CTTCATCGAT GGAAAGCGCA GCGAGCTGGC CTCCACGCGC 
ACCGCCGGCG TGCTGAACCC GAGCACCGGC GAAGTTCAGT CCGAGGTGCT GCTCGCCAGC 
GCCGCCGACG TCGACACCGC GGTGGCCTCC GCGGTCGAGG CGCAGAAGGA GTGGGCGGCG 
TGGAACCCGC AGCGCCGCGC CCGCGTGTTC ATGAAGTTCA TCCAGCTTGT CAATGATCAC 
GTCGACGAGC TCGCCGAGCT GCTGTCCATC GAGCACGGCA AGACCGTCGC CGACTCCAAG 
GGCGACATCC AGCGCGGCAT CGAGGTCATC GAGTTCGCCA TCGGCATCCC GCACCTGCTC 
AAGGGCGAGT TCACCGAGAA CGCCGGCACC GGCATCGACG TCTACTCGAT CCGCCAGCCC 
CTCGGCGTCG TCGCCGGCAT CACCCCGTTC AACTTCCCCG CGATGATCCC GCTGTGGAAG 
GCCGGCCCCG CGCTGGCATG CGGAAACGCG TTCATCCTCA AGCCTTCCGA GCGCGACCCG 
TCGGTGCCGC TGCGGCTGGC CGAGCTGTTC CTCGAAGCCG GCCTGCCCGC GGGCGTCTTC 
CAGGTCGTCC AGGGTGACAA GGAAGCCGTC GACGCGATCC TGACCCACCC CGACATCCAG 
GCCGTCGGCT TCGTCGGGTC CTCCGACATC GCGCAGTACA TCTACTCGAC CGCGGCCGCC 
CACGGCAAGC GCTCACAGTG CTTCGGCGGC GCGAAGAACC ACATGATCAT CATGCCCGAC 
GCCGACCTCG ACCAGGCCGT CGACGCACTC ATCGGCGCCG GCTACGGCAG CGCCGGCGAG 
CGCTGCATGG CCATCAGCGT CGCCGTCCCC GTCGGCGAGG AAACCGCCAA CCGCCTCCGT 
AATCGCCTGG TGGAGCGCGT CAACCAGCTC CGCGTGGGCC ACAGCCTCGA CCCGAAGGCC 
GACTACGGCC CGCTGGTGAC CGGCGCCGCA CTCGAGCGGG TCCGCGACTA CATCGGCCAG 
GGCGTCGAGG CCGGCGCCGA ACTCGTCGTC GACGGCCGCG AGCGCGCCAC CGACGAACTG 
AGCTTCGACG ACCAGGACCT GTCGAAGGGC TACTTCATCG GCCCCACCCT GTTCGACCAC 
GTCACCACCG ACATGTCGAT CTACACCGAC GAGATCTTCG GCCCCGTGCT GTGCATCGTG 
CGCGCCGCCG ACTACGACGA AGCACTGAGC CTGCCCACCA AGCACGAATA CGGCAACGGT 
GTCGCGATCT TCACCCGCGA CGGCGACGCC GCCCGCGACT TCGTGTCCAA GGTCCAGGTC 
GGCATGGTCG GCGTCAACGT CCCGATCCCG GTGCCCGTCG CCTACCACAC CTTCGGCGGC 
TGGAAGCGCT CCGGCTTCGG TGACCTCAAC CAGCACGGCC CGGCCTCGAT CCAGTTCTAC 
ACCAAGGTCA AGACCGTCAC CGAGCGCTGG CCCTCGGGCA TCAAGGATGG CGCCGAGTTC 
GTCATCCCGA CGATGAAATA G

Protein sequence

MTTRIPHFID GKRSELASTR TAGVLNPSTG EVQSEVLLAS AADVDTAVAS AVEAQKEWAA 
WNPQRRARVF MKFIQLVNDH VDELAELLSI EHGKTVADSK GDIQRGIEVI EFAIGIPHLL 
KGEFTENAGT GIDVYSIRQP LGVVAGITPF NFPAMIPLWK AGPALACGNA FILKPSERDP 
SVPLRLAELF LEAGLPAGVF QVVQGDKEAV DAILTHPDIQ AVGFVGSSDI AQYIYSTAAA 
HGKRSQCFGG AKNHMIIMPD ADLDQAVDAL IGAGYGSAGE RCMAISVAVP VGEETANRLR 
NRLVERVNQL RVGHSLDPKA DYGPLVTGAA LERVRDYIGQ GVEAGAELVV DGRERATDEL 
SFDDQDLSKG YFIGPTLFDH VTTDMSIYTD EIFGPVLCIV RAADYDEALS LPTKHEYGNG 
VAIFTRDGDA ARDFVSKVQV GMVGVNVPIP VPVAYHTFGG WKRSGFGDLN QHGPASIQFY 
TKVKTVTERW PSGIKDGAEF VIPTMK