Gene Mjls_5000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_5000
Symbol
ID	4880698
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	-
Start bp	5238739
End bp	5239941
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	66%
IMG OID	640142310
Product	virulence factor Mce family protein
Protein accession	YP_001073255
Protein GI	126437564
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1463] ABC-type transport system involved in resistance to organic solvents, periplasmic component
TIGRFAM ID	[TIGR00996] virulence factor Mce family protein

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.587247
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAGATA TCGACGCAAA GCGCAGTCAC GTACGCATCG CCGCCGCGAT CATGGCGTCG 
ATCATCGTCG CCGCCGCGGT GTTCACCTAC CTGTCGTACA CCGCGGCGTT CACCTCGACC 
GACACCGTCA CCGTCTTCTC ACCGCGCGCC GGGCTGGTCA TGGAGACCGA TGCGAAGGTC 
AAGTACCGCG GCATCCAGAT CGGCAAGGTC AAGGAGATCG AGTACGCCGG GGACCAGGCG 
AAGCTGACCC TGGCCATCCG CAGCGACGAG ATGAAGTACA TCCCGGCCAA CGCCCCCGTG 
CGCATCGCGG GTACGACGGT GTTCGGCGCC AAGGCCGTCG AGTTCATCCC GCCGGAGAAG 
GCGCAGCAGA CGTCGTTGCG GCCCGGGGCC GAAGTGCAGG CCTCCGACGT CCAACTCGAG 
GTCAACACGC TGTTCCAGAC CCTGACCGAT GTGCTCGGCA AGATCGACCC GATCAACCTC 
AACGCCACCA TCAGCGCGCT GGGGGAGGGC TTACGCGGTA ACGGCGACGA TGTGGGCGCC 
CTGCTCGAGG GCCTCAATTA CTACGTGGCG CGGCTGAACC CGAAGCTGCC CACACTGCAG 
GAGGACTTCC GCAGGGCCGC CGAGGTGACC AACATCTACG GCGACGCCGG CCCGGACATC 
GCGCGGATCC TCGACAACGC CCCGACGATC AGCAACACGA TCGTCGACCA GCAGGACAAC 
CTCAATGCGA CACTGCTGGC CGCCACGGGT CTGGCCAACA ACGGCACCGC CACGCTGGAA 
CCGGCCGCCG ACAACTACAT CGCGGCGATC CAGCGGTTGC GGGCGCCGTT GAAGGTGGCC 
GGTGAGTACT CCCCGGTGAT CGGCTGCGTG CTCAAGGGCA CCGCCGTCGC CGTCGAGCGG 
TTCGCCCCGA TCATCGGCGG TATCCGGCCG GGCCTGTTCG TGTCCTCGAA CTTCCTCCCC 
GGCTCACCGG CGTACACGTA CCCGGAGAGC CTGCCCATCG TCAACGCCTC CGGCGGTCCC 
AACTGCCGCG GCCTGCCGGA CGTGCCCAAC AAGCAGTACG GCGGCTCCTG GTACCACACC 
CCGTTCGTGG TCACCGACAA CGCCTATGTG CCGTACCAGC CGAACACCGA GCTGCAGTTC 
GACGCTCCCT CGACGCTGCA GTTCCTGTTC AACGGCGCGT TCGCGGAGAA GGACGAGTAC 
TGA

Protein sequence

MPDIDAKRSH VRIAAAIMAS IIVAAAVFTY LSYTAAFTST DTVTVFSPRA GLVMETDAKV 
KYRGIQIGKV KEIEYAGDQA KLTLAIRSDE MKYIPANAPV RIAGTTVFGA KAVEFIPPEK 
AQQTSLRPGA EVQASDVQLE VNTLFQTLTD VLGKIDPINL NATISALGEG LRGNGDDVGA 
LLEGLNYYVA RLNPKLPTLQ EDFRRAAEVT NIYGDAGPDI ARILDNAPTI SNTIVDQQDN 
LNATLLAATG LANNGTATLE PAADNYIAAI QRLRAPLKVA GEYSPVIGCV LKGTAVAVER 
FAPIIGGIRP GLFVSSNFLP GSPAYTYPES LPIVNASGGP NCRGLPDVPN KQYGGSWYHT 
PFVVTDNAYV PYQPNTELQF DAPSTLQFLF NGAFAEKDEY