Gene Mjls_3497 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_3497
Symbol
ID	4879208
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	+
Start bp	3688210
End bp	3690243
Gene Length	2034 bp
Protein Length	677 aa
Translation table	11
GC content	68%
IMG OID	640140801
Product	glycoside hydrolase 15-related protein
Protein accession	YP_001071765
Protein GI	126436074
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3387] Glucoamylase and related glycosyl hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.83213
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.993865
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGGCGG GCATGGTTCT GGAACACACC GAGCCCACCG ACGGAGCCGC GACGATCGGG 
CAGCCGGCCT ATCTGCCCGA CACTCCGTTG ACGGTGACGG CGCCGGTCCC CTACGCGCCG 
ACCGGTGGGC TGCGGAACCC GTTCCCGCCC ATCGCCGACT ACGGCTTCCT GTCCGACTGC 
GAGAACACGT GCCTGATCTC CTCGGCCGGC TCCGTCGAGT GGCTGTGCGT GCCCCGCCCG 
GATTCGCCGA GCGTGTTCGG CGCGATCCTC GACCGCGGTG CAGGTCACTT CCGGCTCGGC 
CCGTACGGCG TGACGGTGCC CGCGGCGCGG CGTTACCTGC CGGGCAGCCT GATCCTCGAG 
ACCACGTGGC AGACCCACAC CGGCTGGCTG ATCGTGCGCG ACACCCTGGT GATGGGTCCC 
TGGCACGACC TCGAGGCGCG GTCGCGCACC CACCGGCGCA CGCCGATGGA CTGGGATGCC 
GAGCACATCC TGTTGCGCAC CGTGCGGTGT GTCAGTGGCA CCGTCGAGCT GGTGATGAAC 
TGTGAGCCGT CGTTCGACTA CCACCGGGTG AGCGCCGAGT GGGAGTACTC CGGCCCGGCC 
TACGGTGAGG CGATCGCGCG CGCCAACCGC AACGCCGACT CCCATCCGAC GCTGCGGCTC 
ACCACGAACC TGCGGATCGG GTTGGAGGGC CGCGAGGCCA GGGCCCGCAC CCGGCTCAAG 
GAGGGCGACA ACGTCTTCGT GGCGCTGTCC TGGTCGAAGC ATCCGGCGCC GCAGAACTAC 
GAAGAGGCCG CCGACAAGAT GTGGCAGACC AGCGAGGCGT GGCGGCAGTG GATCAACGTC 
GGCGACTTCC CCGACCACCC GTGGCGGGCG TACCTGCAGC GCAGCGCGCT CACACTCAAG 
GGCCTGACCT ACTCCCCGAC CGGCGCGCTG TTGGCCGCGA GCACCACGTC GTTGCCGGAA 
ACACCTCAGG GCGAACGCAA TTGGGACTAC CGCTACGCGT GGGTGCGGGA TTCGACGTTC 
GCACTGTGGG GTCTCTACAC GCTGGGCCTG GACCGCGAGG ACGACGACTT CTTCGCGTTC 
ATCGCCGACG TGTCCGGCGC CAACAACGGG GAGCGCCACC CGCTGCAGGT GATGTACGGC 
GTCGGGGGTG AGCGCAGCCT GGTCGAGGAG GAACTGCACC ACCTGTCGGG GTACGACGGC 
GCCCGCCCGG TGCGGATCGG CAACGGTGCC TACAACCAGA TGCAGCACGA CATCTGGGGC 
ACCATGCTCG ATTCGGTCTA CCTGCACACC AAGTCGCGTG AGCAGATCCC CGAGGCGTTG 
TGGCCGGTGC TCAAGCACCA GGTCGAGGAG GCCATCAAGC ACTGGAAGGA ACCCGACCGC 
GGCATCTGGG AGGTCCGCGG CGAACCGCAG CACTTCACCA GTTCGAAGGT GATGTGCTGG 
GTGGCGCTCG ACCGTGGCGC GAAGCTCGCC GAACTCGAGG GCGAGAAGAG CTACGCCCAG 
GAGTGGCGCA CCATCGCCGA GCAGATCAAG GCCGACATCC TCGCCAACGG CGTCGACTCG 
CGGGGCGTGT TCACCCAGCG TTACGGCGAC GACGCGCTGG ACGCCTCCCT GCTGCTGGTG 
CCGCTGGTCC GGTTCCTGCC GCCGGACGAC CCGCGGGTGC GGGCCACGGT GCTGGCGATC 
GCCGACGAGC TGACCGAGGA GGGTCTGGTC CTGCGCTACC GCGTCGAGGA GACCGACGAC 
GGGTTGGCCG GCGAGGAGGG CACGTTCACG ATCTGCTCGT TCTGGCTGGT GTCGGCGCTC 
GTGGAGATCG GTGAGATCAG CCGTGCCAAG CACCTGTGTG AACGGTTGTT GTCGTTCGCC 
AGTCCGCTGC ACCTCTACGC CGAGGAAATC GAACCCCGCA CCGGCCGCCA TCTGGGCAAC 
TTCCCGCAGG CGTTCACCCA CCTGGCCTTG ATCAACGCGG TCGTGCACGT CATCCGCGCC 
GAGGAGGAAG CCGACAGCTC GGGGGTCTTC GTCCCGGCCA ACGCGCCGTC GTAA

Protein sequence

MMAGMVLEHT EPTDGAATIG QPAYLPDTPL TVTAPVPYAP TGGLRNPFPP IADYGFLSDC 
ENTCLISSAG SVEWLCVPRP DSPSVFGAIL DRGAGHFRLG PYGVTVPAAR RYLPGSLILE 
TTWQTHTGWL IVRDTLVMGP WHDLEARSRT HRRTPMDWDA EHILLRTVRC VSGTVELVMN 
CEPSFDYHRV SAEWEYSGPA YGEAIARANR NADSHPTLRL TTNLRIGLEG REARARTRLK 
EGDNVFVALS WSKHPAPQNY EEAADKMWQT SEAWRQWINV GDFPDHPWRA YLQRSALTLK 
GLTYSPTGAL LAASTTSLPE TPQGERNWDY RYAWVRDSTF ALWGLYTLGL DREDDDFFAF 
IADVSGANNG ERHPLQVMYG VGGERSLVEE ELHHLSGYDG ARPVRIGNGA YNQMQHDIWG 
TMLDSVYLHT KSREQIPEAL WPVLKHQVEE AIKHWKEPDR GIWEVRGEPQ HFTSSKVMCW 
VALDRGAKLA ELEGEKSYAQ EWRTIAEQIK ADILANGVDS RGVFTQRYGD DALDASLLLV 
PLVRFLPPDD PRVRATVLAI ADELTEEGLV LRYRVEETDD GLAGEEGTFT ICSFWLVSAL 
VEIGEISRAK HLCERLLSFA SPLHLYAEEI EPRTGRHLGN FPQAFTHLAL INAVVHVIRA 
EEEADSSGVF VPANAPS