Gene Mkms_3375 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_3375
Symbol
ID	4611301
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	3538311
End bp	3540200
Gene Length	1890 bp
Protein Length	629 aa
Translation table	11
GC content	67%
IMG OID	639793048
Product	dihydrolipoamide acetyltransferase
Protein accession	YP_939359
Protein GI	119869407
COG category	[C] Energy production and conversion
COG ID	[COG0508] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide acyltransferase (E2) component, and related enzymes
TIGRFAM ID	[TIGR02927] 2-oxoglutarate dehydrogenase, E2 component, dihydrolipoamide succinyltransferase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0437306
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGTGA CATTCGACCC GATACGACTG AGCCGTTCGA GGGAGTCACA ACACATGGCC 
GTCTCTGTTC AGATGCCCGC ACTCGGTGAG AGCGTCACCG AAGGCACCGT CACCCGGTGG 
CTCAAGCAAG AGGGTGACAC GGTCGAACAG GACGAACCCC TACTCGAAGT GTCGACCGAC 
AAGGTCGACA CCGAGATCCC GTCCCCGGCC TCCGGCGTGC TGCAGAAGAT CGTGGCGCAG 
GAAGACGACA CCGTCGAGGT CGGCGGGGAA CTCGCCGTGA TCGGCGAGGG CGGCGAGGAT 
TCGGGCGACT CCTCCGACGA CTCGTCTTCC GACGAGGACG AGGACGAGGA GCCTGCGGAG 
GAAGCGGAGT CGGAGACCAC CTCCGAGGAG TCCGACAGCT CCGAGGAGAC CGACAGCTCC 
GAAGAGACCG AGAGCGAGCC GGAACCCGAA CCGGAGCCGA AGAAGGAGTC GAAGCCGAAG 
CCGAAGTCCT CGGGTTCGGC GACCCCGGTG ACGATGCCCG AGCTGGGTGA GTCCGTCACC 
GAGGGCACGG TCACCCGGTG GCTCAAGAAG GTCGGCGACA GCGTCGAGGT CGACGAACCG 
CTGCTGGAGG TGTCGACCGA CAAGGTGGAC ACCGAGATCC CCTCGCCGGT CGCGGGCACC 
CTGCTCGAGA TCATCGCCGA GGAGGACGAC ACGGTCGAGG TCGGCGGGGA ACTCGCGAAG 
ATCGGCGATG CCGATCAGGC CGAGGCCGAA GAGCCCGAAC CGGAGCCGGA ACCCGAGCCG 
GAGCCGGAGC CCGAACCCGA ACCGGAACCC GAGCCGAAGC AGGAGTCCAA GCCGGAGCCG 
AAGCCCGAGC CCAAACAGGA GTCCAAGCAG GAAGCCAAGC CCGAGCCCAA GAAGGAGCCC 
GAGCCGCAGC AGGATGCCGA GCCGTCCGAC GGCAGCGGCC CGTACGTCAC GCCGCTGGTG 
CGCAAACTGG CCGCCGAGCA CGACGTGGAC CTGGCCGCCG TCAAGGGCAC CGGAGTCGGC 
GGACGCATCC GCAAGCAGGA CGTCCTGGCG GCGGCCGAGG CCGACAAGAA GGCCAAGTCC 
GGCCCCGAGG ACGCCGCCGA GGCACCCGGG AAGGCGCCGG CCGCGGCGAC GGCATCCGCG 
AACGCCTCGG ACGCACCGCT GGCTCACCTG CGCGGCACCA AGCAGAAGGC CAACCGGATC 
CGTCAGCTGA CCGCGAAGAA GACGCGCGAA TCCCTGCAGG CGACAGCGCA GTTGACGCAG 
ACCCACGAGG TCGACATGAC CAAGATCGTG GCGTTGCGGG CCAAGGCGAA AAACGACTTC 
GCCGAGCGCG AGGGCGTCAA CCTGACCTAT CTGCCATTCA TCGCCAGGGC GGTCATCGAC 
GCGCTCAAAC AGCATCCGAA CGTCAACGCC AGCTACAACG AGGACACCAA GGAGATCACC 
TACTACGACG CCGAGCACCT CGGCTTCGCG GTGGACACCG ATCAGGGTCT GCTCTCGCCG 
GTTATCAAGA ACGCCGGTGA CCTCTCGCTG GCCGGGCTGG CCCGCGCGAT CGCCGACATC 
GCCGCGCGTG CCCGCTCCGG TGACCTCAAA CCGGACGAAC TGTCCGGCGG CACCTTCACG 
ATCACCAACA TCGGCAGCCA GGGCGCCCTG TTCGACACGC CGATCCTGGT GCCGCCGCAG 
GCGGCGATGC TGGGCACCGG TGCGATCGTC AAACGGCCGC GGGTGATCGT CGACGAGTTC 
GGCAACGAGT CGATCGGCGT GCGGTCGATC TGCTACCTGC CGCTGACCTA CGACCACCGA 
CTCATCGACG GTGCCGACGC CGGTCGCTTC CTGACCACCA TCAAGCGCCG ACTCGAAGAG 
GGTTCGTTCG AGGCAGACCT GGGTCTGTAA

Protein sequence

MGVTFDPIRL SRSRESQHMA VSVQMPALGE SVTEGTVTRW LKQEGDTVEQ DEPLLEVSTD 
KVDTEIPSPA SGVLQKIVAQ EDDTVEVGGE LAVIGEGGED SGDSSDDSSS DEDEDEEPAE 
EAESETTSEE SDSSEETDSS EETESEPEPE PEPKKESKPK PKSSGSATPV TMPELGESVT 
EGTVTRWLKK VGDSVEVDEP LLEVSTDKVD TEIPSPVAGT LLEIIAEEDD TVEVGGELAK 
IGDADQAEAE EPEPEPEPEP EPEPEPEPEP EPKQESKPEP KPEPKQESKQ EAKPEPKKEP 
EPQQDAEPSD GSGPYVTPLV RKLAAEHDVD LAAVKGTGVG GRIRKQDVLA AAEADKKAKS 
GPEDAAEAPG KAPAAATASA NASDAPLAHL RGTKQKANRI RQLTAKKTRE SLQATAQLTQ 
THEVDMTKIV ALRAKAKNDF AEREGVNLTY LPFIARAVID ALKQHPNVNA SYNEDTKEIT 
YYDAEHLGFA VDTDQGLLSP VIKNAGDLSL AGLARAIADI AARARSGDLK PDELSGGTFT 
ITNIGSQGAL FDTPILVPPQ AAMLGTGAIV KRPRVIVDEF GNESIGVRSI CYLPLTYDHR 
LIDGADAGRF LTTIKRRLEE GSFEADLGL