Gene Mjls_2026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_2026
Symbol
ID	4877747
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	+
Start bp	2133175
End bp	2134389
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	68%
IMG OID	640139324
Product	metallopeptidase MEROPS family protein
Protein accession	YP_001070304
Protein GI	126434613
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0750] Predicted membrane-associated Zn-dependent proteases 1
TIGRFAM ID	[TIGR00054] RIP metalloprotease RseP

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.456946
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0994336
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGTTTG CTCTCGGCAT CGTGCTCTTC GCACTGGCCA TCCTGGTGTC GGTAGCCCTG 
CACGAATGCG GCCACATGTG GGTCGCGCGG GCCACCGGGA TGAAGGTGCG CCGGTACTTC 
GTCGGGTTCG GGCCCACCCT GTGGTCGACT CACCGCCCCA ACCGCCTCGG CAGCACCGAG 
TACGGCGTCA AGGCCGTACC GCTCGGCGGG TTCTGCGATA TCGCGGGTAT GACGTCGGTC 
GAGGAACTCG CCCCGGAGGA CCGCCCGTAC GCCATGTACC GGCAGAAGGT GTGGAAGCGC 
GTCGCCGTGC TGTTCGCCGG ACCGGGGATG AACTTCGTCA TCGGCCTGGT CCTCGTCTAC 
GCCATCGCGG TGATCTGGGG CCTGCCGAAC CTGAACCCCC CGACCGCCGC GATCGTCGGC 
CAGACCGGCT GTGTCGCACC GCAGCTCAGC AAGGACCAGA TCGGCGAGTG CACCGGGCCC 
GGCCCGGCGG CGCAGGCCGG TATCCAGGCC GGCGACGTGA TCGTCAAGGT CGGCGACACC 
GACGTCGCGA CGTTCGACGA GGCTCGGGTG ACCCTGCAGA AGTCCTCCGG CCCGACACCG 
ATCGTCATCG AGCGGGACGG CCAGGAACTC ACCAAGGTGG TCGACGTCAC CCAGACCCAG 
CGCTTCACCG GCGAGGGCGA CCAACCGACC ACCGTCGGCG CGATCGGCAT CGCCGCCGCG 
CAGTTCGGGC CGACCCAGCA CAACGCGCTC TCGGCGGTGC CCGCCACGTT CGCGTTCACC 
GGCGACCTCG CCGTCGAACT GGGTAAGTCG CTGGCCAAGA TCCCCACCAA GGTGGGCGCG 
CTGGTGGACT CCATCGGCGG TGGTGAGCGT GATCCCGAGA CGCCGATCAG CGTCGTGGGC 
GCCAGCATCA TCGGCGGCGA CACCGTCGAC GCGGGGCTGT GGGTGGCCTT CTGGTTCTTC 
CTGGCCCAGC TCAACTTCGT CCTCGGCGCG GTGAACCTGG TGCCGCTGCT GCCGTTCGAC 
GGTGGACACA TCGCGATCGC CGTGTTCGAG AAGATCCGCA ACATGATCCG GTCGGCCCGC 
GGCATGGTGG CCGCGGCGCC GGTGAACTAC CTCAAGCTCA TGCCCGCCAC CTACGTAGTG 
TTGGTGGTGG TGGTCGGCTA CATGCTGCTG ACCGTGACCG CTGACCTGGT CAACCCGATC 
AGGTTGTTCC AATAG

Protein sequence

MMFALGIVLF ALAILVSVAL HECGHMWVAR ATGMKVRRYF VGFGPTLWST HRPNRLGSTE 
YGVKAVPLGG FCDIAGMTSV EELAPEDRPY AMYRQKVWKR VAVLFAGPGM NFVIGLVLVY 
AIAVIWGLPN LNPPTAAIVG QTGCVAPQLS KDQIGECTGP GPAAQAGIQA GDVIVKVGDT 
DVATFDEARV TLQKSSGPTP IVIERDGQEL TKVVDVTQTQ RFTGEGDQPT TVGAIGIAAA 
QFGPTQHNAL SAVPATFAFT GDLAVELGKS LAKIPTKVGA LVDSIGGGER DPETPISVVG 
ASIIGGDTVD AGLWVAFWFF LAQLNFVLGA VNLVPLLPFD GGHIAIAVFE KIRNMIRSAR 
GMVAAAPVNY LKLMPATYVV LVVVVGYMLL TVTADLVNPI RLFQ