Gene ECH74115_5437 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5437
Symbol	murB
ID	6972277
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	5084187
End bp	5085215
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	47%
IMG OID	643389087
Product	UDP-N-acetylenolpyruvoylglucosamine reductase
Protein accession	YP_002273492
Protein GI	209396487
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0812] UDP-N-acetylmuramate dehydrogenase
TIGRFAM ID	[TIGR00179] UDP-N-acetylenolpyruvoylglucosamine reductase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00119493
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.00675039
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACCACT CCTTAAAACC CTGGAACACA TTTGGCATTG ATCATAATGC TCAGCACATT 
GTATGTGCCG AAGACGAACA ACAACTACTC AATGCCTGGC AGCATGCAAC CGCAGAAGGG 
CAACCCGTTC TTATTCTGGG TGAAGGAAGT AATGTACTTT TTCTGGAAGA CTATCGCGGC 
ACGGTGATCA TCAACCGGAT CAAAGGTATC GAAATTCATG ATGAACCTGA TGCGTGGTAT 
TTACATGTAG GAGCCGGAGA AAACTGGCAT CGCCTGGTAA AATACACTTT GCAGGAAGGT 
ATGCCTGGTC TGGAAAATCT GGCATTAATT CCTGGTTGTG TCGGCTCATC ACCTATCCAG 
AATATTGGTG CTTATGGCGT AGAATTACAG CGAGTTTGCG CTTATGTTGA TTGTGTTGAA 
CTGGCGACAG GCAAGCAAGT GCGCTTAACT GCCAAAGAGT GCCGTTTTGG CTATCGCGAC 
AGTATTTTTA AACATGAATA CCAGGACCGC TTCGCCATTG TAGCCGTAGG TCTGCGTCTG 
CCAAAAGAGT GGCAACCTGT ACTAACGTAT GGTGACTTAA CTCGTCTGGA TCCTACAACA 
GTAACGCCAC AGCAAGTATT TGATGCGGTG TGTCATATGC GCACCACCAA ACTCCCTGAT 
CCAAAAGTGA ATGGCAATGC CGGTAGTTTC TTCAAAAACC CTGTTGTATC TGCCGAAACG 
GCTAAAGCAT TACTGTCACA ATTTCCAACA GCACCAAATT ACCCCCAGGC GGATGGTTCA 
GTAAAACTGG CAGCAGGTTG GCTTATCGAT CAGTGCCAGC TAAAAGGGAT GCAAATGGGT 
GGGGTTGCGG TGCACCGTCA ACAGGCGTTA GTTCTCATTA ATGAAGACAA TGCAAAAAGC 
GAAGATGTGG TGCAACTGGC ACACCATGTA AGACAAAAAG TGGGTGAAAA ATTTAATGTC 
TGGCTTGAGC CTGAAGTCCG CTTTATTGGT GCATCAGGTG AAGTGAGCGC AGTGGAGACA 
ATTTCATGA

Protein sequence

MNHSLKPWNT FGIDHNAQHI VCAEDEQQLL NAWQHATAEG QPVLILGEGS NVLFLEDYRG 
TVIINRIKGI EIHDEPDAWY LHVGAGENWH RLVKYTLQEG MPGLENLALI PGCVGSSPIQ 
NIGAYGVELQ RVCAYVDCVE LATGKQVRLT AKECRFGYRD SIFKHEYQDR FAIVAVGLRL 
PKEWQPVLTY GDLTRLDPTT VTPQQVFDAV CHMRTTKLPD PKVNGNAGSF FKNPVVSAET 
AKALLSQFPT APNYPQADGS VKLAAGWLID QCQLKGMQMG GVAVHRQQAL VLINEDNAKS 
EDVVQLAHHV RQKVGEKFNV WLEPEVRFIG ASGEVSAVET IS