Gene EcolC_4048 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_4048
Symbol	murB
ID	6065008
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4459244
End bp	4460272
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	46%
IMG OID	641603467
Product	UDP-N-acetylenolpyruvoylglucosamine reductase
Protein accession	YP_001726974
Protein GI	170022020
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0812] UDP-N-acetylmuramate dehydrogenase
TIGRFAM ID	[TIGR00179] UDP-N-acetylenolpyruvoylglucosamine reductase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0452163
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00307055
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACCACT CCTTAAAACC CTGGAACACA TTTGGCATTG ATCATAATGC TCAGCACATT 
GTATGTGCCG AAGACGAACA ACAATTACTC AATGCCTGGC AGCATGCAAC CGCAGAAGGA 
CAACCCGTTC TTATTCTGGG TGAAGGAAGT AATGTACTTT TTCTGGAAGA CTATCGCGGC 
ACGGTGATCA TCAACCGGAT CAAAGGTATC GAAATTCATG ATGAACCTGA TGCGTGGTAT 
TTACATGTAG GAGCCGGAGA AAACTGGCAT CGCCTGGTAA AATACACTTT GCAGGAAGGT 
ATGCCTGGTC TGGAAAATCT GGCATTAATT CCTGGTTGTG TCGGCTCATC ACCTATCCAG 
AATATTGGTG CTTATGGCGT AGAATTACAG CGAGTTTGCG CTTATGTTGA TTGTGTTGAA 
CTGGCGACAG GCAAGCAAGT GCGCTTAACT GCCAAAGAGT GCCGTTTTGG CTATCGCGAC 
AGTATTTTTA AACATGAATA CCAGGATCGC TTCGCCATTG TAGCCGTAGG TCTGCGTCTG 
CCAAAAGAGT GGCAACCTGT ACTAACGTAT GGTGACTTAA CTCGTCTGGA TCCTACAACA 
GTAACGCCAC AGCAAGTATT TAATGCGGTG TGTCATATGC GCACCACCAA ACTCCCTGAT 
CCAAAAGTGA ATGGCAATGC CGGTAGTTTC TTCAAAAACC CTGTTGTATC TGCCGAAACG 
GCTGAAGCAT TACTGTCACA ATTTCCAACA GCACCAAATT ACCCCCAGGC GGATGGTTCA 
GTAAAACTGG CAGCAGGTTG GCTTATTGAT CAGTGCCAGC TAAAAGGGAT GCAAATGGGT 
GGGGCTGCGG TGCACCGTCA ACAGGCGTTA GTTCTCATTA ATGAAGACAA TGCAAAAAGC 
GAAGATGTGG TGCAACTGGC ACACCATGTA AGACAAAAAG TGGGTGAAAA ATTTAATGTC 
TGGCTTGAGC CTGAAGTCCG CTTTATTGGT GCATCAGGTG AAGTGAGCGC AGTGGAGACA 
ATTTCATGA

Protein sequence

MNHSLKPWNT FGIDHNAQHI VCAEDEQQLL NAWQHATAEG QPVLILGEGS NVLFLEDYRG 
TVIINRIKGI EIHDEPDAWY LHVGAGENWH RLVKYTLQEG MPGLENLALI PGCVGSSPIQ 
NIGAYGVELQ RVCAYVDCVE LATGKQVRLT AKECRFGYRD SIFKHEYQDR FAIVAVGLRL 
PKEWQPVLTY GDLTRLDPTT VTPQQVFNAV CHMRTTKLPD PKVNGNAGSF FKNPVVSAET 
AEALLSQFPT APNYPQADGS VKLAAGWLID QCQLKGMQMG GAAVHRQQAL VLINEDNAKS 
EDVVQLAHHV RQKVGEKFNV WLEPEVRFIG ASGEVSAVET IS