Gene Mjls_1034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_1034
Symbol
ID	4876775
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	-
Start bp	1121170
End bp	1122780
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	68%
IMG OID	640138348
Product	major facilitator transporter
Protein accession	YP_001069333
Protein GI	126433642
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.283059
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCGACA CCCTCCCGCG CACCGACCAG GATATCGACG CCGAGATCGC CGCTCTGTCG 
AAGCGGAAAC GGATCTGGCT GCTGGTCATC GCCAGCGTCG ACGTGCTGAT GGTCATCTCG 
TCGATGGTGG CGCTCAACGC GGCGCTGCCC GACATCGCGC TGCAGACCTC CGCGACACAG 
TCCCAGTTGA CCTGGATCGT CGACGGTTAC ACGCTGGCGT TGGCCTGCCT GCTGCTGCCG 
GCGGGCGCCC TCGGCGACCG CTACGGCCGG CGGGGTGCGC TCCTGGTGGG CCTCGCGATC 
TTCGCGGTGG CCTCGCTGGC CCCGGTGCTG TTCGACAGCC CGATGCAGAT CATCATCGCG 
CGGGCCGTCG CCGGCGTCGG CGCGGCGCTC ATCATGCCCG CCACCCTCTC GCTGCTCACC 
GCCGCGTTCC CGAAGTCCGA GCGCAACAAG GCCGTCGGCA TCTGGGCCGG CGTGGCGGGG 
TCGGGCGCGA TCTTCGGCTT CCTCGGTACC GGGCTCCTGC TGAACTACTT CTCGTGGCAG 
TCGATCTTCT ACATGTTCGC CGGCGGGGCA CTGCTGATGT TCGTGGCGAC CTGCACCATC 
GGCTCTTCCC GCGACGAGAC CGCCACCCCC ATCGACTGGG TGGGCGCCGC GCTGATCGGC 
ACCGCGATCG CGGTGTTCGT GCTGGGGGTG GTCGAGGCGC CGGTACGCGG GTGGACCGAC 
CCGGCAGTGC TCGGTTGTCT GGGCGCCGGG GTGGTGCTGG CCGGGTTGTT CGCCGTGGTC 
CAGCTGCGCC GTGCGCATCC ACTGCTCGAT GTCCGGTTGT TCCGACGGCC GGATTTCGCC 
ACTGGCGCCG CAGGCATCAC ATTCCTGTTC ATCGCGAACT TCGGGTTCTT CTACGTCGCG 
ATGCAGTTCA TGCAGCTGGT CATGGGCTAC AGCGCGCTGG AGACCGCATT CGCCTTGTCG 
CCGTTGGCGT TCCCGGTGCT GATACTCGGC GGCACACTGC CTCTGTATCT GCCGAAGGTG 
GGTCTGCGCT TCGCGGTCAC CGTTGGCCTT CTCCTGCTTG CCACGGGCCT GTTCCTCATG 
CGTTTCCTGG AGGCCGACGC GACCTTCCTC GACCTCATGT GGCCAATGCT GCTCGCCGCA 
TCGGGCATCG GACTGTGCAC GGCGCCGACG ACTTCGGCGA TCATGAACGC CGTGCCTGAC 
GAGAAGCAGG GCGTCGCCTC GGCGGTCAAC GACGCCACCC GCGAGGTCGG TGCCGCCGTC 
GGCATCGCAG TGGCGGGATC GGTCCTGGCC GCCGTGTACC AGAGCGCGCT GGCCCCGAAC 
CTCGGCGCTC TGCCCGAGCA GATCCGCGAC GCCGCAACCG ATTCGCTGGC CCACGCGCTG 
GCGATCTCCG AACAGATGGG TCCGCAGGGC GAACAGTTGG CCGACTTCGC TCGAGACGCG 
TTCATGCAGG CCGCCGACCA GGCGTTGTTC GCACTCTCGG CGCTTCTGGT GGTCGGGGCG 
GTCTTCGTGG CGATCTGGTC TCCCGGACGA GACGGACGAC AGTGGGCCGC GATCCGGCGG 
CGGCGAGGAG CAGACGAGAA CCGGTCGGCA CCTGCGGAGG TTGCGCCGTA G

Protein sequence

MVDTLPRTDQ DIDAEIAALS KRKRIWLLVI ASVDVLMVIS SMVALNAALP DIALQTSATQ 
SQLTWIVDGY TLALACLLLP AGALGDRYGR RGALLVGLAI FAVASLAPVL FDSPMQIIIA 
RAVAGVGAAL IMPATLSLLT AAFPKSERNK AVGIWAGVAG SGAIFGFLGT GLLLNYFSWQ 
SIFYMFAGGA LLMFVATCTI GSSRDETATP IDWVGAALIG TAIAVFVLGV VEAPVRGWTD 
PAVLGCLGAG VVLAGLFAVV QLRRAHPLLD VRLFRRPDFA TGAAGITFLF IANFGFFYVA 
MQFMQLVMGY SALETAFALS PLAFPVLILG GTLPLYLPKV GLRFAVTVGL LLLATGLFLM 
RFLEADATFL DLMWPMLLAA SGIGLCTAPT TSAIMNAVPD EKQGVASAVN DATREVGAAV 
GIAVAGSVLA AVYQSALAPN LGALPEQIRD AATDSLAHAL AISEQMGPQG EQLADFARDA 
FMQAADQALF ALSALLVVGA VFVAIWSPGR DGRQWAAIRR RRGADENRSA PAEVAP