Gene Mmcs_5120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_5120
Symbol
ID	4113949
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	5414066
End bp	5415400
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	69%
IMG OID	638034278
Product	hypothetical protein
Protein accession	YP_642280
Protein GI	108802083
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3281] Uncharacterized protein, probably involved in trehalose biosynthesis
TIGRFAM ID	[TIGR02457] trehalose synthase-fused probable maltokinase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.776778
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCTCC CCTTCGACGA CTGGCTACCG CAGCAGCGGT GGTACGGCGG ACGCAGTCGT 
GAATTCTCCT CCGCCACACC GGATGTGGTG GTAACCCTGC GTGACGACCT CGACCTGGTG 
CTGCTCACGG TGAACTACGC CGAAGGCAGG CCGGAGCACT ACCAGATCCT GGTGCGCTGG 
GATGCGGCCC CGATCGACGA GTACAGCGTG GTCGCGCGGA TCGGCAGCGA CACCGAACAC 
GGCGAACGCA CCGGCTACGA CGCGCTCTAC GATCCCGCAG CGGCCCATTT CCTGATGACG 
CTGATCGACT CCTCGGCGCA GGTCGGCGAC ATCCGATTCG CGAAGGAACC GGAGGTGACG 
CTGCCGCTGC AGGCCGCGCC GCGGGTGTCG AGCGCCGAAC AGAGCAACAC CAGCGTCATC 
TTCGACCAGG ACGCGATCCT CAAGGTGTTC CGGCGCATCA CCCCCGGTAT CAATCCCGAC 
ATCGAGCTGA ACCGGGTCCT CGCCCGCGCC GGCAACCCGC ACGTCGCTCG GCTGCTCGGG 
TCGTTCGAGA CGACGCTCGA CCGGGAGCCC TACGCGCTGG GCATGGTCAC CGAATTCGCC 
GCGAACTCCG CGGAGGGCTG GGATATGGCA CTCACCAGCA CCCGCGACCT GTTCGCCGAG 
GGCGACCTGT ACGCCGACGA GGTGGGCGGC GATTTCGCCG GGGAGTCGCA CCGGCTCGGC 
GAGGCGGTCG CGTCGGTGCA CTCGACGCTC GCCGCCGAAC TCGGCACCTC GCAGGTGCCG 
TTCCCGCTCG ACACCGTGCT GGAGCGGCTG CAGTCGGTGG CCGATGCGGT ACCCGAACTG 
CAGCCGCACG CCCAGTCGAT CGAGGAGCGC TACCGCAAAC TCGCCGACCA GGAGATCACC 
GTCCACCGGG TGCACGGCGA CCTGCACCTC GGGCAGGTGC TGCGCACCAC AGAGGGCTGG 
CTGTTGATCG ACTTCGAGGG CGAACCGGGC CAACCGCTCG ACGAGCGCCG CCGACCCGAC 
TCCCCGATGC GCGACGTCGC GGGCATGCTG CGGTCCTACG AATACGCGGC CTACCAGCGG 
CTCATCGAAC GCGGCGGCGA CGCCCAGCAC GACAAACAGC TCGCCGCCCG GGCCCGGGAG 
TGGGTGAACC GCAACGTCAG CTCGTTCTGC GACGGGTACG CCGCCGCGTC GGGCACCGAT 
CCGCGTGACC ATGCCGAACT ACTGGCCGCC TACGAACTCG ACAAGGCGGT CTACGAGGTC 
GGCTACGAGG CGCGGTACCG GCCGAGCTGG CTGCCGATCC CGATGAAGTC GATCCTGCGG 
ATCCTCGGCG TGTGA

Protein sequence

MNLPFDDWLP QQRWYGGRSR EFSSATPDVV VTLRDDLDLV LLTVNYAEGR PEHYQILVRW 
DAAPIDEYSV VARIGSDTEH GERTGYDALY DPAAAHFLMT LIDSSAQVGD IRFAKEPEVT 
LPLQAAPRVS SAEQSNTSVI FDQDAILKVF RRITPGINPD IELNRVLARA GNPHVARLLG 
SFETTLDREP YALGMVTEFA ANSAEGWDMA LTSTRDLFAE GDLYADEVGG DFAGESHRLG 
EAVASVHSTL AAELGTSQVP FPLDTVLERL QSVADAVPEL QPHAQSIEER YRKLADQEIT 
VHRVHGDLHL GQVLRTTEGW LLIDFEGEPG QPLDERRRPD SPMRDVAGML RSYEYAAYQR 
LIERGGDAQH DKQLAARARE WVNRNVSSFC DGYAAASGTD PRDHAELLAA YELDKAVYEV 
GYEARYRPSW LPIPMKSILR ILGV