Gene Mjls_4679 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_4679
Symbol
ID	4880378
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	-
Start bp	4914227
End bp	4915549
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	70%
IMG OID	640141984
Product	peptidase S1 and S6, chymotrypsin/Hap
Protein accession	YP_001072935
Protein GI	126437244
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0383364
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAACC ACCCGAGGTA TTCGCCGCCG CCGCAACAAC AGCCGGGTCA CCGCCCGGTC 
GGCCCGGACA CGGGGTATCA GGGCGCGGAC CCCTACTCGC AGCAGCAGCC CTACGACTGG 
CGGTACGCGG CGCAACCGCA GCAGCAGTTC CGCGCGCCGT ATGACCCCTA CCGCGGCGCC 
GCCCAGCCGA CCGCTGTGAT GCCGCAGCCG CGCCCGACGC AAAAGCGTTC GCGCGCAGGC 
GCATTGACGG TCGGCGCCTT GGCGGTGGCC GTGGTGTCGG CGGGTATCGG TGGCGGTGTG 
GCGACGATGG TCCAGCAGGA CCGCCCGTCC TTCGGCAGCT CTATCACGGG TGCGGCGCCG 
AGCGTGCCCG CCGCCGCGCT GCCCGCGGGC TCGGTGGAGC AGGTGGCCGC CAAGGTGGTG 
CCGAGTGTGG TGAAGCTGGA GACGAACCTG GGCCGGGCGT CGGAGGAGGG TTCGGGCATC 
ATCCTCACCT CCGACGGTCT GATCCTGACG AACAACCACG TCGTGGCCGC GGCCGCCGAC 
GGTCCCGGGG CCCCCGGCGG CGCTCAGACC AAGGTGATCC TCTCCGACGG CCGCACCACG 
TCGTTCACCG TCGTCGGCAC CGATCCCAGC AGCGACATCG CGGTGGTCCG AGCCGAGAAG 
GTCTCGGGCC TGACGCCGAT CACGCTGGGT TCGTCGAGCG ATCTGCGCGT CGGTCAGGAC 
GTGGTCGCGA TCGGTTCGCC GCTCGGGCTC GAGGGGACGG TCACCACCGG CATCATCAGC 
GCGCTGAACC GGCCGGTCGC CGCCGGCGGC GATACGCGCA ACCAGAACAC GGTCCTCGAC 
GCCATCCAGA CCGACGCCGC GATCAACCCC GGTAACTCGG GTGGTGCGCT GGTGAACATG 
AACGGTGAGC TGGTCGGCGT GAACTCGGCC ATCGCCACCA TGGGCGGTGA CTCGGCGCAG 
GCGCAGAGCG GTTCGATCGG TCTCGGCTTC GCGATCCCCG TGGATCAGGC CAAGCGCATC 
GCCGACGAGT TGATCCAGAA CGGCAGCGCC TCACACGCGT CGCTCGGGGT GCAGGTCAGC 
AACGACGCCG CGACCGACGG TGCGAAGATC GTCGAGGTCA ACCAGGGTGG CGCCGCGGCG 
GCGGCGGGTC TGCCCAGCGG CGTGGTGGTG ACCAAGGTCG ACGACCGGGT GATCAACAGC 
GCCGATGCGC TCGTGGCGGC GGTGCGGTCC AAGGCACCCG GCGACAAGGT CACGCTGACC 
TATCTCGATC CGTCGGGCAA GCCGCAGAGC GTGCAGGTGA CTCTCGGGAA GATGCAGCAG 
TGA

Protein sequence

MTNHPRYSPP PQQQPGHRPV GPDTGYQGAD PYSQQQPYDW RYAAQPQQQF RAPYDPYRGA 
AQPTAVMPQP RPTQKRSRAG ALTVGALAVA VVSAGIGGGV ATMVQQDRPS FGSSITGAAP 
SVPAAALPAG SVEQVAAKVV PSVVKLETNL GRASEEGSGI ILTSDGLILT NNHVVAAAAD 
GPGAPGGAQT KVILSDGRTT SFTVVGTDPS SDIAVVRAEK VSGLTPITLG SSSDLRVGQD 
VVAIGSPLGL EGTVTTGIIS ALNRPVAAGG DTRNQNTVLD AIQTDAAINP GNSGGALVNM 
NGELVGVNSA IATMGGDSAQ AQSGSIGLGF AIPVDQAKRI ADELIQNGSA SHASLGVQVS 
NDAATDGAKI VEVNQGGAAA AAGLPSGVVV TKVDDRVINS ADALVAAVRS KAPGDKVTLT 
YLDPSGKPQS VQVTLGKMQQ