Gene Mjls_3099 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_3099
Symbol
ID	4878812
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	+
Start bp	3239586
End bp	3241322
Gene Length	1737 bp
Protein Length	578 aa
Translation table	11
GC content	69%
IMG OID	640140399
Product	malto-oligosyltrehalose trehalohydrolase
Protein accession	YP_001071369
Protein GI	126435678
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0296] 1,4-alpha-glucan branching enzyme
TIGRFAM ID	[TIGR02402] malto-oligosyltrehalose trehalohydrolase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.567277
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.42888
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGAAT TCGCGGTGTG GGCTCCGCTG CCGGAGCGTG TCCGACTCGA CGTCGAGGGG 
TCGCTGCACC CGATGACGTG CGGTGACGAC GGGTGGTGGC GCATCGAGGT CGACGCCGCA 
CCGGATGCCC GGTACGGCTT CGTCCTCGAC GACGATCCGA AGGTGCTGCC CGATCCCCGC 
TCGCCGCGCC AACCCGACGG CGTGCACGAG CGTTCCCAGT TGTGGCAGCC GGCGCCCGAC 
GCGTGGACCG ACGGTGCGTG GGCGGGCCGC AAGATCGAGG GGTCCGAAAA AGGTCAGGTG 
ATCTACGAAC TGCACACCGG CACCTTCACC CCGGAGGGCA CGTTCGACGC CGCCATCGGC 
AAACTCGACC ACCTGGTCGA CCTCGGTGTC GACTTCGTCG AATTGATGCC GGTCAACGCA 
TTCGGCGGCA CCCACGGCTG GGGATACGAC GGGGTGCTGT GGTACGCCGT GCACGAACCG 
TACGGCGGCC CCGACGCGCT GATCCGGCTG ATCGACGCGT GCCATTCCCG CGGGCTCGGC 
GTGCTCATCG ACGCGGTGTT CAACCACCTC GGCCCGTCGG GCAACTACCT GCCGAAGTTC 
GGCCCGTACC TGTCGTCGGG CAGCAATCCG TGGGGCGAGT CGATCAACAT CGCCGACGCC 
GGGGCGGACG AGGTGCGCCG CTACATCCTG GAATGCGCGC TGCGGTGGAT GCGCGACTTC 
CACGCCGACG GGCTGCGACT CGACGCGGTG CACGCCCTGG TCGACACCAC CGCGATCCAC 
ATCCTCGAGG AGCTGTCCGC CGAAACCGAC GCGCTGGCAG ACGAACTCGG CCGGCCGCTC 
TCGCTGATCG CCGAGAGCGA CATGAACGAT CCCCGGTTGA TCACCCCGCG CGATCAGGGC 
GGTCTGGGCA TGACCGCGCA GTGGGACGAC GACATCCACC ACGCGATCCA CGCCGCGGTG 
TCGGGTGAGA CGCAGGGCTA CTACGGCGAC TGGGGCACCG TCGAGGCGTT GGCGCAGACG 
CTGCGCAACG GTTACTTCCA CGCCGGGACG TTCTCGTCGT TCCGGAACCG CCGCCACGGC 
CGCCCGCTGG ACACCGCCAC CATCCCGGCC ACCCGCCTGC TGGCCTACAC CCTGACCCAC 
GACCAGGTCG GCAACCGGGC CGTCGGCGAC CGGCCGTCAC AGAACCTCGA CACCGGCCAG 
CTCGCGGTCA AGGCCGCGCT TGCGCTCGGA TCTCCGTACA CCGCAATGCT CTTCATGGGC 
GAGGAGTGGG GCTCGTCGTC GCCGTTCCAG TTCTTCAGCA GCCATCCGGA GCCGGAGCTG 
GCCCGGGCGA CCGCCGAGGG ACGCAAGAGG GAATTCGCCG AACACGGGTG GGACGCCGAC 
GAGATCCCCG ATCCGCAGGA TCCGCAGACC TTCCTGCGGT CGAAGCTCAA GTGGGATGAG 
ATCGACGACG GCGACCACGG CCGCCTGCGC GCGCTCTACC GGGAGCTGAT CGCGTTGCGG 
CACAACGAAC CTGACCTCGC CGACCCGTGG CTCGACCACC TACGGATCGA CTACGACGAG 
GCGCAGCGGT GGATCGTGAT GCACCGCGGC AGCCTGTCCA TCGCGTGCAA CCTCGGCGCC 
GACGCGGTGA CCGTGCCGGT CACCGGTGAC GTCGTGCTCG CCTGGGGGGA ACCGGCGCCC 
GAGGGTGACG GCACCCGTCT GGACGGGCAT TCGTTCGCCG TGCTGCGTAC TGACTAG

Protein sequence

MPEFAVWAPL PERVRLDVEG SLHPMTCGDD GWWRIEVDAA PDARYGFVLD DDPKVLPDPR 
SPRQPDGVHE RSQLWQPAPD AWTDGAWAGR KIEGSEKGQV IYELHTGTFT PEGTFDAAIG 
KLDHLVDLGV DFVELMPVNA FGGTHGWGYD GVLWYAVHEP YGGPDALIRL IDACHSRGLG 
VLIDAVFNHL GPSGNYLPKF GPYLSSGSNP WGESINIADA GADEVRRYIL ECALRWMRDF 
HADGLRLDAV HALVDTTAIH ILEELSAETD ALADELGRPL SLIAESDMND PRLITPRDQG 
GLGMTAQWDD DIHHAIHAAV SGETQGYYGD WGTVEALAQT LRNGYFHAGT FSSFRNRRHG 
RPLDTATIPA TRLLAYTLTH DQVGNRAVGD RPSQNLDTGQ LAVKAALALG SPYTAMLFMG 
EEWGSSSPFQ FFSSHPEPEL ARATAEGRKR EFAEHGWDAD EIPDPQDPQT FLRSKLKWDE 
IDDGDHGRLR ALYRELIALR HNEPDLADPW LDHLRIDYDE AQRWIVMHRG SLSIACNLGA 
DAVTVPVTGD VVLAWGEPAP EGDGTRLDGH SFAVLRTD