Gene Mjls_5500 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_5500
Symbol
ID	4881197
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	-
Start bp	5757355
End bp	5758689
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	69%
IMG OID	640142817
Product	hypothetical protein
Protein accession	YP_001073754
Protein GI	126438063
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3281] Uncharacterized protein, probably involved in trehalose biosynthesis
TIGRFAM ID	[TIGR02457] trehalose synthase-fused probable maltokinase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.595048
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCTCC CCTTCGACGA CTGGCTACCG CAGCAGCGGT GGTACGGCGG ACGCAGTCGT 
GAATTCTCCT CCGCCACAGC GGATGTGGTG GTAACCCTGC GTGACGACCT CGACCTGGTG 
CTGCTCACGG TGAACTACGC CGAAGGCAGG CCGGAGCATT ACCAGATCCT GGTGCGCTGG 
GATGCGGCCC CGATCGACGA GTACAGCGCG GTCGCGCGGA TCGGCAGCGA CACCGAACAC 
GGCGAACGCA CCGGCTACGA CGCGCTCTAC GATCCCGCGG CGGCCCATTT CCTGATGACG 
CTGATCGACT CCTCGGCGCA GGTCGGCGAC ATCCGATTCG CGAAGGAACC GGAGGTGACG 
CTGCCGCTGC AGGCCGCGCC GCGGGTGTCG AGCGCCGAGC AGAGCAACAC CAGCGTCATC 
TTCGACCAGG ACGCGATCCT CAAGGTGTTC CGGCGCATCA CCCCCGGTAT CAATCCCGAC 
ATCGAGCTGA ACCGGGTCCT CGCCCGCGCC GGCAACCCGC ACGTCGCTCG GCTGCTCGGG 
TCGTTCGAGA CGACGCTCGA CCGGGAGCCC TACGCGCTGG GCATGGTCAC CGAATTCGCC 
GCGAACTCCG CGGAGGGCTG GGATATGGCA CTCACCAGCA CCCGCGACCT GTTCGCCGAG 
GGCGACCTGT ACGCCGACGA GGTGGGCGGC GATTTCGCCG GGGAGTCGCA CCGGCTCGGC 
GAGGCGGTCG CGTCGGTGCA CTCGACGCTC GCCGCCGAAC TCGGCACCTC GCAGGTGCCG 
TTCCCGCTCG ACACCGTGCT GGAGCGGCTG CAGTCGGTGG CCGATGCGGT ACCCGAACTG 
CAGCCGCACG CCCAGTCGAT CGAGGAGCGC TACCGCAAAC TCGCCGACCA GGAGATCACC 
GTCCACCGGG TGCACGGCGA CCTGCACCTC GGGCAGGTGC TGCGCACCAC AGAGGGCTGG 
CTGTTGATCG ACTTCGAGGG CGAACCGGGC CAACCGCTCG ACGAGCGCCG CCGACCCGAC 
TCCCCGATGC GCGACGTCGC GGGCATGCTG CGGTCCTACG AATACGCGGC CTACCAGCGG 
CTCATCGAAC GCGGCGGCGA CGCCCAGCAC GACAAACAGC TCGCCGCCCG GGCCCGGGAG 
TGGGTGAACC GCAACGTCAG CTCGTTCTGC GACGGGTACG CCGCCGCGTC GGGCACCGAT 
CCGCGTGACC ATGCCGAACT ACTGGCCGCC TACGAACTCG ACAAGGCGGT CTACGAGGTC 
GGCTACGAGG CGCGGTACCG GCCGAGCTGG CTGCCGATCC CGATGAAGTC GATCCTGCGG 
ATCCTCGGCG TGTGA

Protein sequence

MNLPFDDWLP QQRWYGGRSR EFSSATADVV VTLRDDLDLV LLTVNYAEGR PEHYQILVRW 
DAAPIDEYSA VARIGSDTEH GERTGYDALY DPAAAHFLMT LIDSSAQVGD IRFAKEPEVT 
LPLQAAPRVS SAEQSNTSVI FDQDAILKVF RRITPGINPD IELNRVLARA GNPHVARLLG 
SFETTLDREP YALGMVTEFA ANSAEGWDMA LTSTRDLFAE GDLYADEVGG DFAGESHRLG 
EAVASVHSTL AAELGTSQVP FPLDTVLERL QSVADAVPEL QPHAQSIEER YRKLADQEIT 
VHRVHGDLHL GQVLRTTEGW LLIDFEGEPG QPLDERRRPD SPMRDVAGML RSYEYAAYQR 
LIERGGDAQH DKQLAARARE WVNRNVSSFC DGYAAASGTD PRDHAELLAA YELDKAVYEV 
GYEARYRPSW LPIPMKSILR ILGV