Gene Mmcs_0120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_0120
Symbol
ID	4108966
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	134730
End bp	136316
Gene Length	1587 bp
Protein Length	528 aa
Translation table	11
GC content	69%
IMG OID	638029245
Product	virulence factor MCE-like protein
Protein accession	YP_637297
Protein GI	108797100
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1463] ABC-type transport system involved in resistance to organic solvents, periplasmic component
TIGRFAM ID	[TIGR00996] virulence factor Mce family protein

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.265453
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAACGC TCGAGGGATC GAACCGCCTC CGCGGCGGGT TGATGGGCAT CATCATCCTG 
GTGCTCGTCG TCGGGGTCGG ACAGAGCTTC GCCAGCGTGC CTATGCTGTT CGCCAAGCCG 
AGGTACTTCG CGCAGTTCGG CGACACCGGC GGCATCAACC CCGGCGACAA GGTCCGCATC 
GCCGGCGTCG ACGTCGGCGA GGTGCTCAAG ACCGAGATCG AGGGCGACAA GGTCGTCGTC 
GGCTTCACGC TGGGCGGTAC GCAGATCGGC AGTGACAGCC GCGCGGCGAT TCGCACGGAT 
ACGATTCTGG GCCGAAAGAA CATCGAGATC GAACCGCGCG GGTCGGAGGC GCTGCAGTCC 
AACGGCGTCC TGCCGCTGGG TCAGACGACC ACCCCGTACC AGATCTACGA CGCCTTCTTC 
GACCTCACCA AATCGGCGTC CGGCTGGGAC ACCAAGTCGG TGCGCGAATC GCTCAACGTG 
CTGTCGGAGA CGATCGACCA GACCTATCCG CACCTGAGCG CGGCGCTCGA CGGGGTGGCC 
CGCTTCTCCG ACACCATCGG TAAGCGCGAC GAGCAGCTCA AACAGCTGCT GGCCAATGCC 
AACAAGATCG CCGGGGTGCT GGGTGAGCGC AGCGGTCAGG TGAATGCGCT GCTGGTCAAC 
GCGCAGACCC TGCTGGCCGC GATCAACGAG CGCAGCTACG CCGTCGGCCA GCTGCTGGAG 
CGGGTGTCGG CGTTCTCGGA GCAGGTCGAG GGCTTCATCG ACGACAACCC GAACCTCAAC 
AGGGTGCTCG AGCAGCTGCG CGTGATCAGC GACATCCTCG TCGAGCGCAA ATTCGACCTG 
GTCGACGTGC TGACCACGCT GAGCAAGTTC ACCGCATCGC TGGCCGAGGC CTTCGCGTCC 
GGCCCGTACT TCAAGGTCAT GCTGGTCAAC CTGGCGCCCT ACTGGATCCT GCAGCCGTAC 
GTCGACGCGG CGTTCAAGAA GCGCGGCATC GACCCGCAGA AGTTCTGGCG TGACGCCGGT 
CTGCCGGCCT ACCAGTTCCC GGATCCGAAC GGGGTGCGTC AGCCCAACGG TGCGCCGCCG 
CCTGCGCCGG CGACCCTGCA GGGCACTCCG GAGTACCCGA ATCCCGCGGT GCCGAGGGGC 
GACCCATGTT CCTACACCCC GCCGGCCGAC GGCCTGCCCA CACCGGGCAA TCCGCTGCCG 
TGTGCGGACC TGAGCGTCGG CCCGTTCGGC GACAATCCCT ACGGTCCGAA CTACCACGGC 
CGGCCCAACG TGGCGACGTC GGAGCCGAAC CCGAACGGCA TGTTGCCCAC TCCCGGCGTC 
GCCAGTTCCG GGGTGCCGGG TCAGCAGGCG CCCGTGGTGC CGGGTACGCC CGTGCCGCTG 
CCGCCGGCCC CGCCGGGTGC GCGCAACGAG CCGCCGGGAC CGTTCCCCGG TCCGACGGCC 
GTAGGCGGTC AGGTGAACAA CGTGCCGCCG CCGCCGGCGC TGCCGGGTCC GCCGCCGCCG 
CCGGGGCCGG GCCAGCAGCT GTCGCCCGCC CAGACGGGTC CGCTGCCGGG CAATCCACCG 
TTCCTCCCGC CGGGATCTCA ACAATGA

Protein sequence

MRTLEGSNRL RGGLMGIIIL VLVVGVGQSF ASVPMLFAKP RYFAQFGDTG GINPGDKVRI 
AGVDVGEVLK TEIEGDKVVV GFTLGGTQIG SDSRAAIRTD TILGRKNIEI EPRGSEALQS 
NGVLPLGQTT TPYQIYDAFF DLTKSASGWD TKSVRESLNV LSETIDQTYP HLSAALDGVA 
RFSDTIGKRD EQLKQLLANA NKIAGVLGER SGQVNALLVN AQTLLAAINE RSYAVGQLLE 
RVSAFSEQVE GFIDDNPNLN RVLEQLRVIS DILVERKFDL VDVLTTLSKF TASLAEAFAS 
GPYFKVMLVN LAPYWILQPY VDAAFKKRGI DPQKFWRDAG LPAYQFPDPN GVRQPNGAPP 
PAPATLQGTP EYPNPAVPRG DPCSYTPPAD GLPTPGNPLP CADLSVGPFG DNPYGPNYHG 
RPNVATSEPN PNGMLPTPGV ASSGVPGQQA PVVPGTPVPL PPAPPGARNE PPGPFPGPTA 
VGGQVNNVPP PPALPGPPPP PGPGQQLSPA QTGPLPGNPP FLPPGSQQ