Gene Mjls_1848 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_1848
Symbol
ID	4877570
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	-
Start bp	1952627
End bp	1954192
Gene Length	1566 bp
Protein Length	521 aa
Translation table	11
GC content	73%
IMG OID	640139145
Product	glycoside hydrolase family protein
Protein accession	YP_001070127
Protein GI	126434436
COG category	[S] Function unknown
COG ID	[COG1543] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGACG ACGCTCGGGT ACCGGGGCTG TTCACCCTCG TCCTGCACAC GCATCTGCCG 
TGGCTGGCGC ACCACGGCCG CTGGCCGGTC GGCGAGGAGT GGCTCTACCA GTCGTGGTCG 
GCGTCGTACC TGCCGCTGAC GCGCGTGCTG CGCAGGCTGG CCGGCGAGGG CCGCGACCAT 
CTGCTCACCC TCGGGATGAC ACCGGTGGTG ACCGCTCAGC TCGACGACCC CTACTGCCTG 
ACCGGGATGC ACAGCTGGCT GGCGAACTGG CAGCTGCGGG CACTGGAGGC CGCCACCCTG 
CGCGCCTCCT CGGACACCAC ACCGGCGTGC ACACCGGAAG CGTTGCGCGC CTTCGGTGTT 
CGCGAGCAGG GCGAGGCGGA GCTGGCGCTC GAGGAGTTCG CCACACTGTG GCGCCACGGC 
GGCAGTCCGC TGCTGCGTGA GCTCGTCGAC GCGGGCACCG TCGAACTGCT GGGCGGGCCG 
CTGGCGCATC CGTTCCAGCC GTTGCTCAAC CCCCGACTGC GGGAGTTCGC GCTGCGCGAA 
GGGCTCGCCG ACGCCGGACA GCGCTTCGCG CACACCCCGC GCGGCATCTG GGCCCCGGAG 
TGCGCGTACG CCCCGGGCAT GGAGGCCGAC TATGCCGCGG CGGGCGTCGG CCACTTCATG 
GTCGACGGCC CGTCGCTGCA CGGCGACACC GCGCTCGGCC GCCCCGTCGG CCACTCCGGC 
GTCGTCGCGT TCGGTCGCGA CCTGCAGGTC AGCTACCGCG TGTGGTCGCC CAAGTCCGGC 
TATCCCGGCC ACGCCGCCTA CCGCGACTTC CACACCTACG ACCACGTCAC CGGGTTGAAG 
CCGGCGCGGG TCACCGGGCG CAACGTGCCG TCGTCGGCCA AAGCCCCATA CGAACCGGAC 
CGCGCCGACG CCGCCATCGA CGCCCACGTC GCCGACTTCG TGCAGGTGGT GCGGCGGCGG 
CTGACGGACG AGAGCGAGCG GATCGGCCGC CCGGCGCACG TGGTCGCCGC CTTCGACACC 
GAACTGTTCG GCCACTGGTG GTACGAGGGG CCGGAGTGGC TGGCCCGCGT ACTGCGGGCG 
CTGCCGGAAG CCGGTGTGCG GGTGGGCACG CTCAGCGATG CCGTCGACGG CGGATTCGTC 
GGCGCCCCAG TCGATCTGCC GCCCAGTTCG TGGGGTTCGG GTAAGGACTG GCAGGTCTGG 
GCCGGAGACC AGGTGACCGA CTTCGTCCGA CTCAACGCCG AGGTCGTCGA CACCGCGCTC 
AGCACCGTCG ACAAGGCGCT CACCCAGCGC GCGTCGGTGG GCAGCCCGAC ACCGCGGGAC 
ACCGTCGCCG ACCAGATCCT GCGCGAGACC CTGCTGACCG TCTCGAGCGA CTGGCCGTTC 
ATGGTGAGCA AGGACTCCGC GGCCGACTAC GCCCGCTACC GCGCCCACCT GCACGCCCAC 
GCGACCCGCG AGATCGCCGA CGCACTCGCG GCCGGCCGGC GGGAGCAGGC CCAGCGCCTC 
GCCGACGGCT GGAACCGCGC CGACGGCCTG TTCGGCGCCC TCGACGCCCG CCGGTTACCG 
CGATGA

Protein sequence

MSDDARVPGL FTLVLHTHLP WLAHHGRWPV GEEWLYQSWS ASYLPLTRVL RRLAGEGRDH 
LLTLGMTPVV TAQLDDPYCL TGMHSWLANW QLRALEAATL RASSDTTPAC TPEALRAFGV 
REQGEAELAL EEFATLWRHG GSPLLRELVD AGTVELLGGP LAHPFQPLLN PRLREFALRE 
GLADAGQRFA HTPRGIWAPE CAYAPGMEAD YAAAGVGHFM VDGPSLHGDT ALGRPVGHSG 
VVAFGRDLQV SYRVWSPKSG YPGHAAYRDF HTYDHVTGLK PARVTGRNVP SSAKAPYEPD 
RADAAIDAHV ADFVQVVRRR LTDESERIGR PAHVVAAFDT ELFGHWWYEG PEWLARVLRA 
LPEAGVRVGT LSDAVDGGFV GAPVDLPPSS WGSGKDWQVW AGDQVTDFVR LNAEVVDTAL 
STVDKALTQR ASVGSPTPRD TVADQILRET LLTVSSDWPF MVSKDSAADY ARYRAHLHAH 
ATREIADALA AGRREQAQRL ADGWNRADGL FGALDARRLP R