Gene Mkms_5034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_5034
Symbol
ID	4612713
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	5274354
End bp	5275577
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	68%
IMG OID	639794727
Product	saccharopine dehydrogenase
Protein accession	YP_941013
Protein GI	119871061
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1748] Saccharopine dehydrogenase and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAATCC TGTTGGTGGG TGCCGGCGGT GTCGGTTCGG CGTTCTGCGC GATCGCCGCG 
CGCCGTGAAT TCTTCGAGCA GATCGTCGTC TGCGACTACG ACGAGGCCAG AGCTCGCCGG 
GCCGCCGAGG CGGTGGGCGA CGCGCGGTTC GTCGCGGCAC AGGTGGATGC CACGTCGGCC 
GATGCGGTCG CGGCGCTGGT GCGCGAACAC GCGATCACCC ACGTCATGAA CGCCGTCGAC 
CCGCGGTTCG TCATGCCGAT CTTCAACGGT GCGCTGGCCG GGGGAGCGGA CTACCTCGAC 
ATGGCGATGA GCCTGTCGCG ACGCCACCCG GAACAGCCCT ACGAGTTGAC CGGGGTGAAA 
CTCGGCGACG AGCAGTTCGC CGCCGAGGCC GACTGGTCCG CGGCCGGTCG CCTGGCCCTG 
GTGGGCATCG GCGTGGAGCC CGGGCTGTCG GACGTGTTCG CCCGCTACGC CGCCGATCAC 
CTGTTCTCCG ACATCGACGA ACTCGGCACC CGCGACGGGT CGAACCTCAC GGTCGACGGT 
CACGACTTCG CGCCGTCGTT CTCGATCTGG ACGACCATCG AGGAATGCCT GAACCCTCCG 
GTGATCTGGG AGGACGGCCG CGGCTGGTTC GTCACCGAAC CGTTCAGCGA ACCGGAGGTC 
TTCGACTTCC CGGACGGCAT CGGTCCGGTC GAATGTGTCA ACGTCGAGCA CGAAGAGGTG 
CTGCTGATGC CGCGTTGGGT CAAATGCAGA CGCGCGACGT TCAAATACGG TCTGGGCGCG 
GAGTTCATCG ACGTGCTCAA GACGCTGCAC AAGCTGGGGC TGGACCGCAC CGACACGGTG 
ACCGTCGGCA GCGGCAAGGG CCCGGTCGAG GTGTCCCCGC GCGACGTGGT GGCCGCGTGT 
CTGCCCAACC CGGCCACGCT CGGCCCCAAC ATGCGCGGCA AGACCTGCGC CGGGCTCTGG 
GTCACGGGAA CCGGCAGGGA CGGCAACCCG CGGTCGACGT ACCTGTATCA CGTGGTGGAC 
AACGAGTGGT CGATGGCCGA ATACGGCCAC CAGTGCGTCG TCTGGCAGAC CGCCATCAAT 
CCCGTTGTGG CACTGGAACT CCTGGCCAAC GGCACCTGGA GCGGGGCCGG TGTGCTCGGA 
CCGGAGGCGT TCGACGCGGT GCCGTTCCTG GAACTGCTGA CCGCCTACGG CTCACCGTGG 
GGGGTCAAGG AGCTGACGCC GTAG

Protein sequence

MRILLVGAGG VGSAFCAIAA RREFFEQIVV CDYDEARARR AAEAVGDARF VAAQVDATSA 
DAVAALVREH AITHVMNAVD PRFVMPIFNG ALAGGADYLD MAMSLSRRHP EQPYELTGVK 
LGDEQFAAEA DWSAAGRLAL VGIGVEPGLS DVFARYAADH LFSDIDELGT RDGSNLTVDG 
HDFAPSFSIW TTIEECLNPP VIWEDGRGWF VTEPFSEPEV FDFPDGIGPV ECVNVEHEEV 
LLMPRWVKCR RATFKYGLGA EFIDVLKTLH KLGLDRTDTV TVGSGKGPVE VSPRDVVAAC 
LPNPATLGPN MRGKTCAGLW VTGTGRDGNP RSTYLYHVVD NEWSMAEYGH QCVVWQTAIN 
PVVALELLAN GTWSGAGVLG PEAFDAVPFL ELLTAYGSPW GVKELTP