Gene Mjls_2594 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_2594
Symbol
ID	4878310
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	+
Start bp	2720208
End bp	2721635
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	65%
IMG OID	640139891
Product	extracellular solute-binding protein
Protein accession	YP_001070867
Protein GI	126435176
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0396421
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.707884
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCGAG ATCGGTTCGC GCAGCAACGT CAGCTGTCGC GCCGGAACAT GTTGGCCGCC 
ATGGGAATCG CCGGAGCGGC GGCCGCGAGC CTGCCGGTGC TCTCGGCCTG CGGCGTCGGC 
GGCAAGACCA GCGCCCCGAA CGGCGCCTCG GAGGTGAGCG GCGGATTCGA CTGGCGTAAG 
GCTGCTGGGT CGACGATCAA CATCCTGCAG ACCCCGCACC CGTATCAGCA GAGCTACCAG 
CCGCTGCTCA AGGAGTTCAC CGAGCTCACC GGGATCAACG TCAACGTCGA TCTCGTGCCG 
GAGGCGGACT ACTTCACCAA GCTCAACACC GAACTGGCGG GCGGCACCGG CAAGCACGAT 
GCGTTCATGC TGGGTGCCTA CTTCATCTGG CAGTACGGTC CGCCCGGTTG GATCGAGGAT 
CTCAACCCGT GGCTGCAGAA CGCCTCGGCG ACCAACGCCG AGTACGACTT CGAGGACATC 
TTCGAGGGTC TGCGCACCTC CACGCGGTGG GACTTCACGT TGGGCAACCC ATTGGGCACC 
GGCGGTCAGT GGGCGATCCC GTGGGGGTTC GAGAACAATG TCGTCGCCTA CAACAAGGCC 
TATTTCGACC GGCGGGGCAT CAGGAAACTG CCCGACAACT TCGACGATTT CATCCAGCTG 
GCCGTGGACC TGACCGACCG CTCGGAGAAC CGGTACGGCA TCGCCACCCG CGGATCGAAG 
TCGTGGGCCA CGATCCACCC GGGCTTCATG ACGCAGTACG TCCGCGAAGG CGCCGTCGAC 
TACACGTTCG ACGGCCGCGA TCTGGTCGCC GAGATGGACA GCGACAAGGC CGTCGACTTC 
ACCGAGAAGT GGATCCGGAT GCAGCACGAG GCGGGCCCCA CCTCGTGGAC CACCTACGAC 
TACCCGAACG CCACCGGTGA TCTCGGTGAC GGCAAGGCGA TGATGGTCTA CGACGCCGAC 
AGCGCGACGT ATCCGAAGAA CAAGCCCGGC GCGAGCGCAC AGGCGGGGAA CCTCGGCTGG 
TATCCGGGTC CGGCCGGCCC CGACGGCAAC TACAAGACCA ACCTGTGGAC CTGGACGTGG 
GCGATGAACG CCAACTCCCG CAACAAACTG CCGGCCTGGC TGTTCATCCA GTGGGCCACC 
GGCAAGGAGT CGATGAACAA AGCCGTCGAG GGCGGCATCT ACGCAGATCC GGTGCGGCAG 
TCGGTGTTCG ACACGACGTT CAAGCGGATC GCCGCCGATC AGTACGGCTA CCTCGAGACC 
TTCGAGACGG TGATCCCCAC CTCCAAGATC CAGTTCACCC CGCAGAAGAA GTTCTTCGAC 
ACCACCAAGG ACTGGGCCGT TGCGCTGCAG GACATCTACG GCGGGGACGA CGCCGCGTCC 
CGGCTGCGCA GCCTGGCCAA GACCAACACC TCCAAGGTCA ACCTCTAG

Protein sequence

MSRDRFAQQR QLSRRNMLAA MGIAGAAAAS LPVLSACGVG GKTSAPNGAS EVSGGFDWRK 
AAGSTINILQ TPHPYQQSYQ PLLKEFTELT GINVNVDLVP EADYFTKLNT ELAGGTGKHD 
AFMLGAYFIW QYGPPGWIED LNPWLQNASA TNAEYDFEDI FEGLRTSTRW DFTLGNPLGT 
GGQWAIPWGF ENNVVAYNKA YFDRRGIRKL PDNFDDFIQL AVDLTDRSEN RYGIATRGSK 
SWATIHPGFM TQYVREGAVD YTFDGRDLVA EMDSDKAVDF TEKWIRMQHE AGPTSWTTYD 
YPNATGDLGD GKAMMVYDAD SATYPKNKPG ASAQAGNLGW YPGPAGPDGN YKTNLWTWTW 
AMNANSRNKL PAWLFIQWAT GKESMNKAVE GGIYADPVRQ SVFDTTFKRI AADQYGYLET 
FETVIPTSKI QFTPQKKFFD TTKDWAVALQ DIYGGDDAAS RLRSLAKTNT SKVNL