Gene EcSMS35_0095 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0095
Symbol	murG
ID	6146870
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	106277
End bp	107344
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	56%
IMG OID	641614996
Product	undecaprenyldiphospho-muramoylpentapeptide beta-N- acetylglucosaminyltransferase
Protein accession	YP_001742212
Protein GI	170683320
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0707] UDP-N-acetylglucosamine:LPS N-acetylglucosamine transferase
TIGRFAM ID	[TIGR01133] undecaprenyldiphospho-muramoylpentapeptide beta-N-acetylglucosaminyltransferase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.130586
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGGTC AAGGAAAGCG ATTAATGGTG ATGGCAGGCG GAACCGGTGG ACATGTATTC 
CCGGGACTGG CGGTTGCGCA CCATCTAATG GCTCAGGGTT GGCAAGTTCG CTGGCTGGGG 
ACTGCCGACC GTATGGAAGC GGACTTAGTG CCAAAACATG GCATCGAAAT TGATTTCATT 
CGTATCTCTG GTCTGCGTGG AAAAGGTATA AAAGCACTGA TAGCTGCGCC GCTGCGTATC 
TTCAACGCCT GGCGTCAGGC GCGGGCGATT ATGAAAGCGT ACAAACCTGA CGTGGTGCTC 
GGTATGGGCG GCTATGTATC AGGTCCAGGT GGTCTGGCTG CGTGGTCGTT AGGCATTCCG 
GTTGTACTTC ATGAACAAAA CGGTATTGCG GGCTTAACCA ATAAATGGCT GGCGAAGATT 
GCTACCAAAG TGATGCAGGC GTTTCCAGGC GCTTTCCCTA ATGCGGAAGT GGTGGGTAAC 
CCGGTGCGTA CCGATGTGCT GGCGCTGCCG TTGCCGCAGC AACGTTTGGC TGGACGTGAA 
GGTCCGGTTC GTGTGTTGGT AGTGGGTGGT TCCCAGGGCG CACGCATTCT TAATCAGACA 
ATGCCGCAGG TTGCTGCAAA ACTGGGTGAT TCAGTCACTA TCTGGCATCA GAGCGGCAAA 
GGTTCGCAAC AATCCGTTGA ACAGGCGTAT GCCGAAGCGG GACAACCGCA GCATAAAGTG 
ACGGAATTTA TTGATGATAT GGCGGCGGCG TATGCGTGGG CGGATGTCGT TGTTTGCCGC 
TCCGGTGCGT TAACGGTGAG TGAAATCGCC GCGGCAGGAC TTCCGGCGTT GTTTGTGCCG 
TTTCAACATA AAGACCGTCA GCAATACTGG AATGCGCTAC CGCTGGAAAA AGCGGGCGCA 
GCCAAAATTA TCGAGCAGCC ACAGCTTAGC GTGGATGCTG TCGCCAACAC CCTGGCCGGG 
TGGTCGCGAG AAACCTTATT AACCATGGCA GAACGCGCCC GGGCTGCATC CATTCCGGAT 
GCCACCGAGC GAGTGGCAAA TGAAGTGAGC CGGGCTGCCC GGGCGTAA

Protein sequence

MSGQGKRLMV MAGGTGGHVF PGLAVAHHLM AQGWQVRWLG TADRMEADLV PKHGIEIDFI 
RISGLRGKGI KALIAAPLRI FNAWRQARAI MKAYKPDVVL GMGGYVSGPG GLAAWSLGIP 
VVLHEQNGIA GLTNKWLAKI ATKVMQAFPG AFPNAEVVGN PVRTDVLALP LPQQRLAGRE 
GPVRVLVVGG SQGARILNQT MPQVAAKLGD SVTIWHQSGK GSQQSVEQAY AEAGQPQHKV 
TEFIDDMAAA YAWADVVVCR SGALTVSEIA AAGLPALFVP FQHKDRQQYW NALPLEKAGA 
AKIIEQPQLS VDAVANTLAG WSRETLLTMA ERARAASIPD ATERVANEVS RAARA