Gene Mkms_4334 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_4334
Symbol	glmU
ID	4612276
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	4553308
End bp	4554801
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	72%
IMG OID	639794019
Product	bifunctional N-acetylglucosamine-1-phosphate uridyltransferase/glucosamine-1-phosphate acetyltransferase
Protein accession	YP_940315
Protein GI	119870363
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1207] N-acetylglucosamine-1-phosphate uridyltransferase (contains nucleotidyltransferase and I-patch acetyltransferase domains)
TIGRFAM ID	[TIGR01173] UDP-N-acetylglucosamine diphosphorylase/glucosamine-1-phosphate N-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.699537
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.383191
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTCTT CGACGACCTC TTCGACCGAT ACTGCAGTTC TCGTGCTGGC CGCGGGCGCG 
GGCACCCGGA TGCGCTCGGA CATCCCGAAG GTGCTGCACA CCCTCGGCGG CCGCAGCATG 
CTCGCGCACG CCCTGCACAC CGTGGCGAAG GTGGCCCCGC AGCACCTGGT GGTGGTGCTC 
GGACACGACC GCGAACGCAT CGCCCCCGCC GTCGAGGCGC TGGCCACCGA CCTCGGCCGC 
CCGATCGACG TCGCGATCCA GGATCAGCAG CTCGGCACCG GCCACGCCGC CGAGTGCGGG 
CTCGCGGCGC TGCCCGAGGA CTTCACGGGG GTCGTCGTGG TGACCGCGGG CGACGTCCCG 
CTGCTCGACG CCGACACCAT GGCCGACCTG CTGGCCACCC ACGGTTCGGC CGCGGCCACC 
GTGCTGACCA CGACCGTCGA CGACCCGACC GGGTACGGGC GCATCCTGCG GACCCAGGAC 
AACGAGGTCA CCAGCATCGT CGAACAGGCC GACGCCAGCC CGTCGCAGCG GGCCATCCGC 
GAGGTCAACG CCGGCGTCTA CGCCTTCGAC ATCACCGCGC TGCGTTCGGC GCTGCGCCGC 
CTGCGGTCCG ACAACGCCCA GCACGAGCTG TACCTCACCG ACGTCATCGC GATCTTCCGG 
CAGGACGGCC TCAGCGTGCG GGCCCGGCAC GTCGACGACA GCGCCCTGGT GGCCGGCGTC 
AACGACCGCG TGCAGTTGGC GGCGCTGGGC GCCGAGCTCA ACCGCCGCAT CGTCACCGCC 
CACCAGCGCG CCGGTGTCAC CGTGATCGAC CCGGGCTCCA CCTGGATCGA CGTCGACGTG 
ACCATCGGCC GCGACACCGT CATCCGGCCC GGCACCCAGT TGCTCGGCCG CACCCGCGTC 
GGCGGGCGTT GTGACGTCGG ACCGGACACC ACGCTGAGCG ACGTCACCGT CGGCGACGGC 
GCCTCGGTGG TCCGCACCCA CGGCTCGGAG TCCCTCATCG GCGCCGGCGC CACCGTCGGC 
CCGTTCACCT ATCTGCGGCC GGGCACCGCG CTGGGCGCCG AGGGCAAACT CGGTGCATTC 
GTGGAGACGA AGAACGCGAC GATCGGTGCA GGCACCAAGG TGCCGCACCT GACCTACGTC 
GGCGACGCCG ACATCGGCGA GCACAGCAAC ATCGGCGCGT CGAGCGTCTT CGTCAACTAC 
GACGGCGAGA CCAAGAACCG CACGACCATC GGGTCGCACG TGCGGACCGG CTCGGACACC 
ATGTTCGTCG CGCCCGTGAC CGTCGGGGAC GGCGCCTACA CCGGTGCGGG CACGGTGATC 
CGGCGCAACG TGCCGCCGGG CGCGCTGGCG GTCTCGGCCG GGTCGCAGCG CAACATCGAG 
GGCTGGGTGG TCCGCAAACG CCCGGGTTCG GCCGCGGCAC GCGCGGCGGA GCGCGCATCG 
GGTGAAGCAG CGGAGCAGGC GCTCGGCCAC CACGACGACT CCCAGGGGTC GTGA

Protein sequence

MTSSTTSSTD TAVLVLAAGA GTRMRSDIPK VLHTLGGRSM LAHALHTVAK VAPQHLVVVL 
GHDRERIAPA VEALATDLGR PIDVAIQDQQ LGTGHAAECG LAALPEDFTG VVVVTAGDVP 
LLDADTMADL LATHGSAAAT VLTTTVDDPT GYGRILRTQD NEVTSIVEQA DASPSQRAIR 
EVNAGVYAFD ITALRSALRR LRSDNAQHEL YLTDVIAIFR QDGLSVRARH VDDSALVAGV 
NDRVQLAALG AELNRRIVTA HQRAGVTVID PGSTWIDVDV TIGRDTVIRP GTQLLGRTRV 
GGRCDVGPDT TLSDVTVGDG ASVVRTHGSE SLIGAGATVG PFTYLRPGTA LGAEGKLGAF 
VETKNATIGA GTKVPHLTYV GDADIGEHSN IGASSVFVNY DGETKNRTTI GSHVRTGSDT 
MFVAPVTVGD GAYTGAGTVI RRNVPPGALA VSAGSQRNIE GWVVRKRPGS AAARAAERAS 
GEAAEQALGH HDDSQGS