Gene Mkms_1024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_1024
Symbol
ID	4614688
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	1117456
End bp	1119066
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	68%
IMG OID	639790701
Product	major facilitator superfamily transporter
Protein accession	YP_937028
Protein GI	119867076
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.836546
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.65546
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCGACA CCCTCCCGCG CACCGACCAG GATATCGACG CCGAGATCGC CGCTCTGTCG 
AAGCGGAAAC GGATCTGGCT GCTGGTCATC GCCAGTGTCG ACGTGCTGAT GGTCATCTCG 
TCGATGGTGG CGCTCAACGC GGCGCTGCCC GACATCGCGC TGCAGACCTC CGCGACACAG 
TCCCAGTTGA CCTGGATCGT CGACGGTTAC ACGCTGGCGC TGGCCTGCCT GCTGCTGCCG 
GCGGGCGCCA TCGGCGACCG CTACGGTCGG CGGGGTGCGC TCCTGGTGGG CCTCGCGATC 
TTCGCGGTGG CCTCGCTGGC CCCGGTGCTG TTCGACAGCC CGATGCAGAT CATCATCGCG 
CGGGCCGTCG CCGGCGTCGG CGCGGCGCTC ATCATGCCCG CCACCCTCTC GCTGCTCACC 
GCCGCGTTCC CGAAGTCCGA GCGCAACAAG GCCGTCGGCA TCTGGGCCGG CGTGGCGGGG 
TCGGGCGCGA TCTTCGGCTT CCTCGGTACC GGGCTCCTGC TGAACTACTT CTCGTGGCAG 
TCGATCTTCT ACATGTTCGC CGGCGGGGCA CTGCTGATGT TCGTGGCGAC CTGCACCATC 
GGCTCTTCCC GCGACGAGAC CGCCACCCCC ATCGACTGGG TGGGCGCCGC GCTGATCGGC 
ACCGCGATCG CGGTGTTCGT GCTGGGGGTG GTCGAGGCGC CGGTACGCGG GTGGACCGAC 
CCGGCAGTGC TCGGTTGTCT GGGCGCCGGG GTGGTGCTGG CCGGGTTGTT CGCCGTGGTC 
CAGCTGCGCC GTGCGCATCC ACTGCTCGAT GTCCGGTTGT TCCGACGGCC GGATTTCGCC 
ACTGGCGCCG CAGGCATCAC ATTCCTGTTC ATCGCGAACT TCGGGTTCTT CTACGTCGCG 
ATGCAGTTCA TGCAGCTGGT CATGGGCTAC AGCGCGCTGG AGACCGCATT CGCCTTGTCG 
CCGTTGGCGT TCCCGGTGCT GATACTCGGC GGCACACTGC CTCTGTATCT GCCGAAGGTG 
GGTCTGCGCT TCGCGGTCAC CGTTGGCCTT CTCCTGCTTG CCACGGGCCT GTTCCTCATG 
CGTTTCCTGG AGGCCGACGC GACCTTCCTC GACCTCATGT GGCCAATGCT GCTCGCCGCA 
TCGGGCATCG GACTGTGCAC GGCGCCGACG ACTTCGGCGA TCATGAACGC CGTGCCTGAC 
GAGAAGCAGG GCGTCGCCTC GGCGGTCAAC GACGCCACCC GCGAGGTCGG TGCCGCCGTC 
GGCATCGCAG TGGCGGGATC GGTCCTGGCC GCCGTGTACC AGAGCGCGCT GGCCCCGAAG 
CTCGGCGCTC TGCCCGAGCA GATCCGCGAC GCCGCAACCG ATTCGCTGGC CCACGCGCTG 
GCGATCTCCG AACAGATGGG TCCGCAGGGC GAACAGTTGG CCGACTTCGC TCGAGACGCG 
TTCATGCAGG CCGCCGACCA GGCGTTGTTC GCACTCTCGG CGCTTCTGGT GGTCGGGGCG 
GTCTTCGTGG CGATCTGGTC TCCCGGACGA GACGGACGAC AGTGGGCCGC GATCCGGCGG 
CGGCGAGGAG CAGACGAGAA CCGGTCGGCA CCCGCGGAGG TTGCGCCGTA G

Protein sequence

MVDTLPRTDQ DIDAEIAALS KRKRIWLLVI ASVDVLMVIS SMVALNAALP DIALQTSATQ 
SQLTWIVDGY TLALACLLLP AGAIGDRYGR RGALLVGLAI FAVASLAPVL FDSPMQIIIA 
RAVAGVGAAL IMPATLSLLT AAFPKSERNK AVGIWAGVAG SGAIFGFLGT GLLLNYFSWQ 
SIFYMFAGGA LLMFVATCTI GSSRDETATP IDWVGAALIG TAIAVFVLGV VEAPVRGWTD 
PAVLGCLGAG VVLAGLFAVV QLRRAHPLLD VRLFRRPDFA TGAAGITFLF IANFGFFYVA 
MQFMQLVMGY SALETAFALS PLAFPVLILG GTLPLYLPKV GLRFAVTVGL LLLATGLFLM 
RFLEADATFL DLMWPMLLAA SGIGLCTAPT TSAIMNAVPD EKQGVASAVN DATREVGAAV 
GIAVAGSVLA AVYQSALAPK LGALPEQIRD AATDSLAHAL AISEQMGPQG EQLADFARDA 
FMQAADQALF ALSALLVVGA VFVAIWSPGR DGRQWAAIRR RRGADENRSA PAEVAP