Gene Mjls_4520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_4520
Symbol
ID	4880223
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	+
Start bp	4744916
End bp	4746334
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	67%
IMG OID	640141827
Product	NLP/P60 protein
Protein accession	YP_001072780
Protein GI	126437089
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0791] Cell wall-associated hydrolases (invasion-associated proteins)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGCCCC TACGCGAATG GGTCAGCCGC CTCACCGCCG TGACGCTCGG TGTGGCCGTG 
CTGGTCTACG GTGGCGGCAC CGCGCAGGCA TCCCACGATG GCACCAGCCA TTCGGGTTCG 
CAGATCTCCG CCCTGGTCGC CGACCTCGCG CAGGCCAATC AACGCCTGGC CGACATCGGC 
GCGCAGATCC AGGGTCAACA AGAAGGTGTC AATAAAGCGC TGGTGGACGT GGCCAACGCC 
CGCGATGCCG CCGCGGCCGC GCGCCGCGAC GTGCAAGCCA GCGAACAGGG TCTGGCCGAT 
GCGAACGCGG CGATCGCCGC CGCCCAACGA CGTTTCGATG ACTTCGCCGC CGCCACCTAT 
GTCAATGGCC CACCGCAGGC GCTGGTTTCG GCGGCCAGCC CCGAGGACAT CATCGCCACC 
GCCAGCGCCA ATCAGACCCT GGCACTCAGT GCCAGCAATA CGGTGACCGA CCTGCAGCAC 
GCCCGCACCG AACAAGCCAA CCGCGCGTCC ACAGCGCGGG CGGCCCAGCA ACGCGCCGAC 
CAGGCGGCCG CCGATGCCGA GCAAAGCCAA CAGGCAGCGG TGGCCGCCCT GACCGAGGCG 
CAACGCCAGT TCGGTCTGCA GCAGGCCGAA GTCGACCGGC TCGTCGCCGC CCGAGACACC 
GCCAAAGCGC GTCTGGACGC GGCGCGTCCC CAAACTCCAC CCGACAACAC CGCACCGCTG 
ATTGCCGCCG GTGGCACGGC GCCGGCGCCG GACCGGTGGG ACCGGCAAAC CCCGGCAGGT 
GCGACGGCAC CCGCAGACAC CAGTCAGTGG GACACAACCT TGCCGATGGT TCCCAGCGCC 
AACGTCGCCG GCGACCCCAT TGCCATCGTG AACGCGGTGC TGCAGATCTC GTCAACGTCG 
GCGCAGCTGA CTGCCGACAT GGGTCGCAAA TTCCTTACCC AACTCGGGAT CCTGCCCCAA 
GCCTCGGCAC CCGCCGACCC CGGCTTCACC AACGGGCGCA TCCCACGGGT ATATGGCCAG 
CAGGCAATGG AATTGGTGAT CCGCCGGGCC ATGTCGCAGC TGGGTGTGCC CTATTCGTGG 
GGTGGCGGCA ACGCCAACGG CCCGTCCCGA GGTATCGACC AGGGCGCCAA CACCGTGGGA 
TTCGACTGCT CCGGGCTGAT CCTCTACGCT TTTGCCGGCG TGGGCATCAA ACTGGAACAT 
TACTCGGGCA CGCAGTACAA CTCCGGACGC AAAATCCCCT CGTCACAAAT GCGACGCGGC 
GATCTGATCT TCTACGGCCC CAACGCAAGC CAGCATGAGG CGATGTACCT CGGCAACGGT 
CAGATGATCG AAGCGCCCTA CACCGGCTCA CAGGTGCGCA TCGCGCCGGT ACGTACCAGC 
GGCATGATGC CCTACGTCAC CCGACTCATC GAGTATTGA

Protein sequence

MRPLREWVSR LTAVTLGVAV LVYGGGTAQA SHDGTSHSGS QISALVADLA QANQRLADIG 
AQIQGQQEGV NKALVDVANA RDAAAAARRD VQASEQGLAD ANAAIAAAQR RFDDFAAATY 
VNGPPQALVS AASPEDIIAT ASANQTLALS ASNTVTDLQH ARTEQANRAS TARAAQQRAD 
QAAADAEQSQ QAAVAALTEA QRQFGLQQAE VDRLVAARDT AKARLDAARP QTPPDNTAPL 
IAAGGTAPAP DRWDRQTPAG ATAPADTSQW DTTLPMVPSA NVAGDPIAIV NAVLQISSTS 
AQLTADMGRK FLTQLGILPQ ASAPADPGFT NGRIPRVYGQ QAMELVIRRA MSQLGVPYSW 
GGGNANGPSR GIDQGANTVG FDCSGLILYA FAGVGIKLEH YSGTQYNSGR KIPSSQMRRG 
DLIFYGPNAS QHEAMYLGNG QMIEAPYTGS QVRIAPVRTS GMMPYVTRLI EY