Gene Mjls_4006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_4006
Symbol
ID	4879715
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	-
Start bp	4238049
End bp	4239542
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	70%
IMG OID	640141318
Product	peptidase S1 and S6, chymotrypsin/Hap
Protein accession	YP_001072272
Protein GI	126436581
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.503851
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCAATC AGGACCAGGC CAGCCGTCGC ATGGCACCGC GCCCCGTCGA ACGGCCTCCG 
GTCGACCCGG CTGCCCAACG CGCCTTCGGC AGGCCCAGCG GAGTCCGCGG GTCGTTCCTC 
GGCGTCGACC AGCAGCGCGA CCAGGGGCAG TACACCCCGA AGGACAAGGC GCCCGACCCG 
GTGCTGGCCG AGGCCTTCGG CCGTCCGCCC TACAGCGGCG GTGACTCCCT GCAGCGCCAC 
CCCGCCGACG CGGGCGCGCT CGACGCCGAA CGGGCCGGTG ACCCCGGCGA CACCGAACCC 
GATCCGTGGC GCGACCCGCA CGCCCCCGTC GCACTGGGCA CCCCCGCCGT CCACGCCCCC 
GCACCGAGCC ACGCGCCCGC CCAGGTCGGC AAGCTCGGTG TGCGCGACGT CCTGTTCGGC 
CGCAAGGTGT CCTACGCCGG TCTGGCGATC CTGCTGCTCA CCGCGCTGAT GGTCGGCGCG 
CTCGGCGGCT GGGTCGGCAA CAAGACGGCC GAGACGGTGC AGGCGTTCAC CACCTCGAAG 
GTCACGCTGG AGACCGGCGA CAGCGGTGAC CCGCCCGAGG GCCGCATCAC CAAGGTGGCC 
GACGCGGTCG CCGACTCCGT GGTGACCATC GAGGCCAAGA GCGACCAGGA GGGCTCCCAG 
GGTTCCGGTG TGGTGATCGA CGGTCGCGGC TACATCGTCA CCAACAACCA CGTGATCTCC 
GAGGCCGCCA ACAACCCCGC CAAGTACAAG ATGACCGTCG TGTTCAACGA CGGTAAAGAG 
GTCCCCGCCA ACCTGGTCGG CCGCGACCCG AAGACCGACC TCGCCGTGCT GAAGGTCGAC 
AACGTCGACA ACCTCACCGT GGCCAAGATG GGTGACTCGG ACAAACTGCA GGTCGGTGAG 
GAGGTGATCG CCGCGGGCGC CCCGCTGGGT CTGCGCAGCA CCGTCACCTC CGGCATCATC 
AGCGCCCTGC ACCGGCCGGT TCCGCTGTCG GGCGACGGAT CCGACACCGA CACCGTGATC 
GACGGGGTGC AGACCGACGC GTCGATCAAC CACGGCAACT CCGGCGGCCC GCTGATCGAC 
ATGGACGCCA ACGTGATCGG CATCAACACC GCGGGTAAGT CGCTGTCCGA CAGCGCCAGC 
GGTCTGGGCT TCGCGATCCC GGTCAACGAG GTCAAGACCG TCGTCGAGGC GTTGATCAGG 
GACGGCAGGA TCGAGCATCC GACACTCGGC CTGACCGCGA AGTCCGTCAG CAACGACGTG 
GCCTCCGGCG CCCAGGTCGC CAACGTCAAG GCGGGCAGCG CCGCCGAGCG GGCCGGCATC 
CTGGAGAACG ACGTCGTGGT CAAGGTCGGC AACCGCGACG TCGCGGACGC CGACGAGTTC 
GTGGTCGCGG TGCGTCAGCT CAAGATCAAT GAACCCGCCC CGATCGAGGT CGTCCGCGAC 
GGCCGTCCGG TGACGCTCAC CGTGACGCCG ACGCCAGACG CCGCCACCGA CTGA

Protein sequence

MTNQDQASRR MAPRPVERPP VDPAAQRAFG RPSGVRGSFL GVDQQRDQGQ YTPKDKAPDP 
VLAEAFGRPP YSGGDSLQRH PADAGALDAE RAGDPGDTEP DPWRDPHAPV ALGTPAVHAP 
APSHAPAQVG KLGVRDVLFG RKVSYAGLAI LLLTALMVGA LGGWVGNKTA ETVQAFTTSK 
VTLETGDSGD PPEGRITKVA DAVADSVVTI EAKSDQEGSQ GSGVVIDGRG YIVTNNHVIS 
EAANNPAKYK MTVVFNDGKE VPANLVGRDP KTDLAVLKVD NVDNLTVAKM GDSDKLQVGE 
EVIAAGAPLG LRSTVTSGII SALHRPVPLS GDGSDTDTVI DGVQTDASIN HGNSGGPLID 
MDANVIGINT AGKSLSDSAS GLGFAIPVNE VKTVVEALIR DGRIEHPTLG LTAKSVSNDV 
ASGAQVANVK AGSAAERAGI LENDVVVKVG NRDVADADEF VVAVRQLKIN EPAPIEVVRD 
GRPVTLTVTP TPDAATD