Gene Mkms_4044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_4044
Symbol
ID	4611984
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	4267296
End bp	4269236
Gene Length	1941 bp
Protein Length	646 aa
Translation table	11
GC content	70%
IMG OID	639793728
Product	EmrB/QacA family drug resistance transporter
Protein accession	YP_940026
Protein GI	119870074
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily [TIGR00880] Multidrug resistance protein

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCTCCA CGTCCGAAGC GCGACCGGTG ACCGGTGACC CATGGCATGC GCTGTGGGCC 
ATGATGGTCG GCTTCTTCAT GATCCTGGTC GACGCCACCA TCGTGGCGGT CGCCAACCCG 
GTGCTCATGG AGAAGCTGGG CGCCGACTAC GACGCGGTGA TCTGGGTGAC CAGCGCCTAT 
CTGCTGGCCT ACGCGGTCCC GCTGCTGGTA GCGGGTCGGC TGGGGGACCG GTTCGGGCCC 
AAGAACGTCT ACCTGGTCGG TCTGGCCGTA TTCACCGCCG CCTCGCTGTG GTGCGGGCTG 
GCCGGGTCCA TCGACACGCT GATCGCCGCA CGGGTCGTCC AGGGCGTCGG CGCGGCACTG 
CTGACGCCGC AGACCCTGTC GACGATCACC CGCATCTTCC CGCCCGAGCG GCGCGGTGTG 
GCGATGAGTG TGTGGGGTGC GACGGCCGGG GTGGCCACGC TGGTGGGGCC GCTGGCGGGT 
GGCGTGCTGG TGGACCACCT CGGTTGGCAG TGGATCTTCT TCGTCAACGT GCCGGTCGGG 
GTGGCGGGCC TGGCGTTGGC GTTCTGGCGG GTGCCCGCGC TGACCACCAC CGCGCACCGG 
TTCGACCTGC TCGGGGTGCT GCTGTCCGGG GTCGGGATGT TCGCGATCGT CTTCGGGCTG 
CAGGAGGGGC AGTCCCACGG CTGGCAGCCC TGGATCTGGG TGGTCATCGT GGCCGGCGTC 
GCGGTGATGG CCGGGTTCGT CTACTGGCAG TCGGTCAACC CCCACGAACC GTTGATCCCG 
TTGCGGATCT TCGGTGACCG CGACTTCTCG CTGTCCAGCT TCGGCGTCGC CGTCATCGGC 
TTCGTGGTGA CCGGCATGAT CGTGCCCGCG ATGTTCTTCG CCCAGGCGGT GTGTGGGCTG 
TCGCCGACCG AGTCGGCGCT GCTGACCGCG CCGATGGCCA TCACCAGTGG AGTGCTGGCA 
CCCGCGGTCG GGCGAATCGT CGACCGCGCC CATCCGCGAC CGATCGTCGG GTTCGGGTTC 
TCGGCGCTGG CGATCGGGCT GACCTGGTTG TCGATCGAGA TGACGCCGGA TACGCCGATC 
TGGCGGCTGG TCCTGCCGTT CCTCGTGATG GGTATCGGTA TGGCGTTCAT CTGGTCGCCG 
CTGGCGGCCA CCGCGACCCG GAATCTGGCA CCGCATCTCG CCGGCGCCGG GTCCGGCGTC 
TACAACGCGA CGCGTCAGGT CGGGTCGGTG CTGGGCAGCG CCGGCATGGC GGCGTTCATG 
ACGTCGCGGA TCAGCGCGGA GATGCCGTCG GCGCAGGGCG GGGCGCCGCG CGGGGAGGGG 
GCGGTGTCGG CGCTCCCCGA ATTCCTTCAG GTGCCGTTCG CCGCCGCGAT GTCGCAGTCG 
CTGCTGCTGC CGGCGTTCGT GGCGTTGATC GGGGTGGTCG CGGCGATCTT CCTGCGCGGC 
TTCGGCGAGG TATCGGCGCC GGTTGTCGCC GCGCCGGTGG CGCGCGCCGA CCCCCGGGAC 
GACTCCGTCG ACGACAGCCA CGGCTATGAC GACGACGACT ACCTCGAGTA CGCCGTCAGC 
TGGGACGATC TTCAGTTCAC CGAACCCATC TCGACCCGTC CTGAGGTCGG CGCCGACGAC 
AGTGTCACGA CGCCGCTCGC AACGCGGGGC CGCCGCGCGG AGGCGGCCGC CGAGCCGTCC 
GGTGCCGACG ATCCGTGGCG CCGTGTGCTC GACGAACTGC TACCGGAGCC GCCGGCCCGG 
CCCGAGGCCG AGCCGATCGG CTTCGCGCAC AACGGTTTCC ATGTGGAGGG AGAGGAGACG 
CCGGTCGACG ACAGACGGGG CCGGCGATAC CGAGACGACG GCGACGCTGC ACCCGCATGG 
CTGCGCGAGT TCGGTGAACG CTCGCGCCGC GGAACGGACA CCCCCTCCGG CGGCCGTCAT 
TCACGCCGCG ACGGCGACTG A

Protein sequence

MFSTSEARPV TGDPWHALWA MMVGFFMILV DATIVAVANP VLMEKLGADY DAVIWVTSAY 
LLAYAVPLLV AGRLGDRFGP KNVYLVGLAV FTAASLWCGL AGSIDTLIAA RVVQGVGAAL 
LTPQTLSTIT RIFPPERRGV AMSVWGATAG VATLVGPLAG GVLVDHLGWQ WIFFVNVPVG 
VAGLALAFWR VPALTTTAHR FDLLGVLLSG VGMFAIVFGL QEGQSHGWQP WIWVVIVAGV 
AVMAGFVYWQ SVNPHEPLIP LRIFGDRDFS LSSFGVAVIG FVVTGMIVPA MFFAQAVCGL 
SPTESALLTA PMAITSGVLA PAVGRIVDRA HPRPIVGFGF SALAIGLTWL SIEMTPDTPI 
WRLVLPFLVM GIGMAFIWSP LAATATRNLA PHLAGAGSGV YNATRQVGSV LGSAGMAAFM 
TSRISAEMPS AQGGAPRGEG AVSALPEFLQ VPFAAAMSQS LLLPAFVALI GVVAAIFLRG 
FGEVSAPVVA APVARADPRD DSVDDSHGYD DDDYLEYAVS WDDLQFTEPI STRPEVGADD 
SVTTPLATRG RRAEAAAEPS GADDPWRRVL DELLPEPPAR PEAEPIGFAH NGFHVEGEET 
PVDDRRGRRY RDDGDAAPAW LREFGERSRR GTDTPSGGRH SRRDGD