Gene EcolC_3567 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3567
Symbol	murG
ID	6065888
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	3898870
End bp	3899937
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	56%
IMG OID	641602984
Product	undecaprenyldiphospho-muramoylpentapeptide beta-N- acetylglucosaminyltransferase
Protein accession	YP_001726508
Protein GI	170021554
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0707] UDP-N-acetylglucosamine:LPS N-acetylglucosamine transferase
TIGRFAM ID	[TIGR01133] undecaprenyldiphospho-muramoylpentapeptide beta-N-acetylglucosaminyltransferase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.713723
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00628085
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGTGGTC AAGGAAAGCG ATTAATGGTG ATGGCAGGCG GAACCGGTGG ACATGTATTC 
CCGGGACTGG CGGTTGCGCA CCATCTAATG GCTCAGGGTT GGCAAGTTCG CTGGCTGGGG 
ACTGCCGACC GTATGGAAGC GGACTTAGTG CCAAAACATG GCATCGAAAT TGATTTCATT 
CGTATCTCTG GTCTGCGTGG AAAAGGTATA AAAGCACTGA TAGCTGCCCC GCTGCGTATC 
TTCAACGCCT GGCGTCAGGC GCGGGCGATT ATGAAAGCGT ACAAACCTGA CGTGGTGCTC 
GGTATGGGAG GCTACGTGTC AGGTCCAGGT GGTCTGGCCG CGTGGTCGTT AGGCATTCCG 
GTTGTACTTC ATGAACAAAA CGGTATTGCG GGCTTAACCA ATAAATGGCT GGCGAAGATT 
GCCACCAAAG TGATGCAGGC GTTTCCAGGT GCTTTCCCTA ATGCGGAAGT AGTGGGTAAC 
CCGGTGCGTA CCGATGTGTT GGCGCTGCCG TTGCCGCAGC AACGTTTGGC TGGACGTGAA 
GGTCCGGTTC GTGTGCTGGT AGTGGGTGGT TCTCAGGGCG CACGCATTCT TAACCAGACA 
ATGCCGCAGG TTGCTGCGAA ACTGGGTGAT TCAGTCACTA TCTGGCATCA GAGCGGCAAA 
GGTTCGCAAC AATCCGTTGA ACAGGCGTAT GCCGAAGCGG GGCAACCGCA GCATAAAGTG 
ACGGAATTTA TTGATGATAT GGCGGCGGCG TATGCGTGGG CGGATGTCGT CGTTTGCCGC 
TCCGGTGCGT TAACGGTGAG TGAAATCGCC GCGGCAGGAC TACCGGCGTT GTTTGTGCCG 
TTTCAACATA AAGACCGCCA GCAATACTGG AATGCGCTAC CGCTGGAAAA AGCGGGCGCA 
GCCAAAATTA TCGAGCAGCC ACAGCTTAGC GTGGATGCTG TCGCCAACAC CCTGGCCGGG 
TGGTCGCGAG AAACCTTATT AACCATGGCA GAACGCGCCC GCGCTGCATC CATTCCGGAT 
GCCACCGAGC GAGTGGCAAA TGAAGTGAGC CGGGTTGCCC GGGCGTAA

Protein sequence

MSGQGKRLMV MAGGTGGHVF PGLAVAHHLM AQGWQVRWLG TADRMEADLV PKHGIEIDFI 
RISGLRGKGI KALIAAPLRI FNAWRQARAI MKAYKPDVVL GMGGYVSGPG GLAAWSLGIP 
VVLHEQNGIA GLTNKWLAKI ATKVMQAFPG AFPNAEVVGN PVRTDVLALP LPQQRLAGRE 
GPVRVLVVGG SQGARILNQT MPQVAAKLGD SVTIWHQSGK GSQQSVEQAY AEAGQPQHKV 
TEFIDDMAAA YAWADVVVCR SGALTVSEIA AAGLPALFVP FQHKDRQQYW NALPLEKAGA 
AKIIEQPQLS VDAVANTLAG WSRETLLTMA ERARAASIPD ATERVANEVS RVARA