Gene EcHS_A0096 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0096
Symbol	murG
ID	5590910
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	101399
End bp	102466
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	56%
IMG OID	640919284
Product	undecaprenyldiphospho-muramoylpentapeptide beta-N- acetylglucosaminyltransferase
Protein accession	YP_001456879
Protein GI	157159561
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0707] UDP-N-acetylglucosamine:LPS N-acetylglucosamine transferase
TIGRFAM ID	[TIGR01133] undecaprenyldiphospho-muramoylpentapeptide beta-N-acetylglucosaminyltransferase

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	0.178087
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGGTC AAGGAAAGCG ATTAATGGTG ATGGCAGGCG GAACCGGTGG ACATGTATTC 
CCGGGACTGG CGGTTGCGCA CCATCTAATG GCTCAGGGTT GGCAAGTTCG CTGGCTGGGG 
ACTGCCGACC GTATGGAAGC GGACTTAGTG CCAAAACATG GCATCGAAAT TGATTTCATT 
CGTATCTCTG GTCTGCGTGG AAAAGGTATA AAAGCACTGA TAGCTGCCCC GCTGCGTATC 
TTCAACGCCT GGCGTCAGGC GCGGGCGATT ATGAAAGCGT ACAAACCTGA CGTGGTGCTC 
GGTATGGGAG GCTACGTGTC AGGTCCAGGT GGTCTGGCCG CGTGGTCGTT AGGCATTCCG 
GTTGTACTTC ATGAACAAAA CGGTATTGCG GGCTTAACCA ATAAATGGCT GGCGAAGATT 
GCCACCAAAG TGATGCAGGC GTTTCCAGGT GCTTTCCCTA ATGCGGAAGT AGTGGGTAAC 
CCGGTGCGTA CCGATGTGTT GGCGCTGTCG TTGCCGCAGC AACGTTTGGC TGGACGTGAA 
GGTCCGGTTC GTGTGCTGGT AGTGGGTGGT TCTCAGGGCG CACGCATTCT TAACCAGACA 
ATGCCGCAGG TTGCTGCGAA ACTGGGTGAT TCAGTCACTA TCTGGCATCA GAGCGGCAAA 
GGTTCGCAAC AATCCGTTGA ACAGGCGTAT GCCGAAGCGG GGCAACCGCA GCATAAAGTG 
ACGGAATTTA TTGATGATAT GGCGGCGGCG TATGCGTGGG CGGATGTCGT CGTTTGCCGC 
TCCGGTGCGT TAACGGTGAG TGAAATCGCC GCGGCAGGAC TACCGGCGTT GTTTGTGCCG 
TTTCAACATA AAGACCGCCA GCAATACTGG AATGCGCTAC CGCTGGAAAA AGCGGGCGCA 
GCCAAAATTA TCGAGCAGCC ACAGCTTAGC GTGGATGCTG TCGCCAACAC CCTGGCCGGG 
TGGTCGCGAG AAACCTTATT AACCATGGCA GAACGCGCCC GCGCTGCATC CATTCCGGAT 
GCCACCGAGC GAGTGGCAAA TGAAGTGAGC CGGGTTGCCC GGGCGTAA

Protein sequence

MSGQGKRLMV MAGGTGGHVF PGLAVAHHLM AQGWQVRWLG TADRMEADLV PKHGIEIDFI 
RISGLRGKGI KALIAAPLRI FNAWRQARAI MKAYKPDVVL GMGGYVSGPG GLAAWSLGIP 
VVLHEQNGIA GLTNKWLAKI ATKVMQAFPG AFPNAEVVGN PVRTDVLALS LPQQRLAGRE 
GPVRVLVVGG SQGARILNQT MPQVAAKLGD SVTIWHQSGK GSQQSVEQAY AEAGQPQHKV 
TEFIDDMAAA YAWADVVVCR SGALTVSEIA AAGLPALFVP FQHKDRQQYW NALPLEKAGA 
AKIIEQPQLS VDAVANTLAG WSRETLLTMA ERARAASIPD ATERVANEVS RVARA