Gene Mkms_4738 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_4738
Symbol
ID	4616153
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	4965407
End bp	4966930
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	70%
IMG OID	639794430
Product	betaine-aldehyde dehydrogenase
Protein accession	YP_940719
Protein GI	119870767
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGGAC TTCCGCATTA CCGGATGTAC GTCGACGGCG AGTGGCGCGA CGCCGCGGAG 
TCGATCGAGG TGCGCAGCCC GGCAACCGGC GCCCCCGTCG CGACGGTGGC CTACGGTGAC 
CTGACCGCCG TCGACGACGC CGTGGCGGCG GCCAGGGCCG CGCACGAGGC TGGGGTGTGG 
CGATCGATGC CGCCGCAGCA GCGGGCCGAT CTGCTCGACG CCATCGCCGA CAAGCTCGCC 
GCCCGGTCCG ACGAGCTGAC CGCGCTGCAG GTCAGGGAGA ACGGTGCGAC CGTGCGCGGT 
GCCGGCGCGT TCCTGATCGG CTACGCCATC GCGAACCTGA GGTACTTCGC CTCGCTTGCG 
CGCAGCTACG CGTTCCAGAC CAGCGGACCG CTGATCGAGG CGCCGACGCT GGCCTCCGGC 
CTGATCCTGC GGGAGCCGGT CGGGGTGTGC GCGGGCATCA TCCCGTGGAA CTTCCCACTG 
CTGCTGGCGG TCTGGAAGCT GGGACCGGCG CTGGCGGCGG GCAACACCGT CGTGCTCAAA 
CCCGACGACC AGACCCCGCT GACGCTGCTC GAACTCGCCC GCGCCGCAGA CGAAGTCGGG 
CTGCCCGCCG GGGTGCTCAA CGTGGTGACC GGGCCGGGTC CGGTGGCCGG CGCCCGGCTG 
GCCGAACACC CCGACGTCCG CAAGATCGCG TTCACCGGGT CCACCGAGGT GGGCAAGGGT 
GTCATGCGGG CCGCGGCCGA CAACGTCAAG AAGGTCACCC TCGAACTGGG CGGCAAGGGC 
GCCAACATCG TGCTCGAGGA CGCCGATCTC GACCTTGCCG TGGACGGTTC GCTGTTCGCC 
TTCCTGATGA TGAGCGGGCA GGCCTGTGAA TCCGGGACGC GACTGCTGGT GCACGAATCC 
GTTCACGACG AGTTCGTGCG GCGGTTGGTG GCCCGGGCCG AGACGCTGGT GATGGGCGAT 
CCGATGAGCC CGGCGACCGA TCTGGGACCG CTGGTGTCGG CCAAGCAGAA GGCCCGTGTC 
GAGAAGTACA TCGCGCTCGG TCAGGAGGAG GGCTGCCGGA TGGCCTTCCA GGGCACCGTC 
CCGTCGGATC CCGCGCTGGC CGAGGGGCAT TGGGTGCCGC CGGTCATCCT GACCGGGGCC 
ACCAACCAGA TGCGGATCGC CCGCGAGGAG ATCTTCGGCC CGGTGCTGGT GGTCATCCCG 
TTCCGCGACG ACGACGATGC GGTCGCGATC GCCAACGACA GCGAGTACGG GCTGTCGGCG 
GGGGTGTGGA GCGCCGACAA CGGCCGCGCC CTGGGGATCG CCCGCCGGCT GGAGTCGGGA 
ACGGTGTGGG TCAACGACTG GCACATGGTC AACGCGATGT ACCCGTTCGG CGGGGTCAAA 
CAGAGCGGAC TGGGTCGTGA ACTCGGCCCG GACGCGCTCG ACGAGTACAC CGAGCCCAAG 
TTCGTCCACA TCGACCTGAC CAACGACCGT CGCAAACGTG CCTTCGCCGT GGTCGTATCC 
GCGGCGGCAG CCGAATCCGA CTGA

Protein sequence

MTGLPHYRMY VDGEWRDAAE SIEVRSPATG APVATVAYGD LTAVDDAVAA ARAAHEAGVW 
RSMPPQQRAD LLDAIADKLA ARSDELTALQ VRENGATVRG AGAFLIGYAI ANLRYFASLA 
RSYAFQTSGP LIEAPTLASG LILREPVGVC AGIIPWNFPL LLAVWKLGPA LAAGNTVVLK 
PDDQTPLTLL ELARAADEVG LPAGVLNVVT GPGPVAGARL AEHPDVRKIA FTGSTEVGKG 
VMRAAADNVK KVTLELGGKG ANIVLEDADL DLAVDGSLFA FLMMSGQACE SGTRLLVHES 
VHDEFVRRLV ARAETLVMGD PMSPATDLGP LVSAKQKARV EKYIALGQEE GCRMAFQGTV 
PSDPALAEGH WVPPVILTGA TNQMRIAREE IFGPVLVVIP FRDDDDAVAI ANDSEYGLSA 
GVWSADNGRA LGIARRLESG TVWVNDWHMV NAMYPFGGVK QSGLGRELGP DALDEYTEPK 
FVHIDLTNDR RKRAFAVVVS AAAAESD