Gene ECH74115_0094 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0094
Symbol	murF
ID	6969213
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	99236
End bp	100594
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	55%
IMG OID	643384171
Product	UDP-N-acetylmuramoyl-tripeptide--D-alanyl-D- alanine ligase
Protein accession	YP_002268694
Protein GI	209398779
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0770] UDP-N-acetylmuramyl pentapeptide synthase
TIGRFAM ID	[TIGR01143] UDP-N-acetylmuramoyl-tripeptide--D-alanyl-D-alanine ligase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTAGCG TAACCCTTAG CCAACTTACC GACATTCTCA ACGGTGAACT GCAAGGTGCA 
GATATCACCC TTGATGCTGT AACCACTGAT ACCCGAAAAC TGACGCCGGG CTGCCTGTTT 
GTTGCCCTGA AAGGCGAACG TTTCGATGCT CATGATTTTG CCGACCAGGC GAAAGCTGGC 
GGCGCAGGCG CACTACTGGT TAGCCGTCCG CTGGATATCG ACCTGCCGCA GTTAATCGTC 
AAGGATACGC GTCTGGCGTT TGGTGAACTG GCTGCATGGG TTCGCCAGCA AGTTCCGGCG 
CGCGTGGTTG CTCTGACAGG TTCCTCCGGC AAAACCTCCG TTAAAGAGAT GACGGCGGCG 
ATTTTAAGCC AGTGCGGCAA CACGCTTTAT ACGGCAGGCA ATCTCAACAA CGACATCGGT 
GTACCGATGA CGCTGTTGCG CTTAACGCCG GAATACGATT ACGCAGTTAT TGAACTTGGC 
GCGAACCATC AGGGCGAAAT TGTCTGGACT GTGAGTCTGA CTCGCCCGGA AGCTGCGCTG 
GTCAACAACC TGGCAGCGGC GCATCTGGAA GGTTTTGGCT CGCTTGCGGG TGTCGCGAAA 
GCGAAAGGTG AAATCTTTAG CGGCCTGCCG GAAAACGGTA TCGCCATTAT GAACGCCGAC 
AACAACGACT GGCTGAACTG GCAGAGCGTA ATTGGCTCAC GCAAAGTGTG GCGTTTCTCA 
CCTAATGCCG CCAACAGCGA TTTCACCGCC ACCAATATCC ATGTGACTTC GCACGGTACG 
GAATTTACCC TGCAAACCCC AACCGGTAGC GTGGATGTTC TGCTGCCGTT GCCGGGGCGT 
CACAATATTG CGAATGCGCT GGCAGCCGCT GCGCTCTCCA TGTCCGTGGG CGCAACGCTT 
GATGCTATCA AAGCGGGGCT GGCAAATCTG AAAGCTGTTC CAGGCCGTTT GTTCCCCATT 
CAACTGGCAG AAAACCAGTT GCTGCTCGAC GACTCCTACA ACGCCAATGT CGGTTCAATG 
ACCGCCGCTG TTCAGGTACT GGCTGAAATG CCGGGCTACC GCGTGCTGGT GGTGGGCGAT 
ATGGCGGAAC TGGGCGCTGA AAGCGAAGCC TGCCATGTAC AGGTGGGCGA GGCGGCAAAA 
GCTGCTGGTA TTGACCGCGT GTTAAGCGTG GGTAAACAAA GCCATGCTAT CAGCACCGCC 
AGCGGCGTTG GCGAACATTT TGCTGAGAAA ACTGCGTTAA TTACGCGTCT TAAATCACTG 
ATTGCTGAGC AACAGGTAAT TACGATTTTA GTTAAGGGTT CACGTAGTGC CGCCATGGAA 
GAGGTAGTAC GCGCTTTACA GGAGAATGGG ACATGTTAG

Protein sequence

MISVTLSQLT DILNGELQGA DITLDAVTTD TRKLTPGCLF VALKGERFDA HDFADQAKAG 
GAGALLVSRP LDIDLPQLIV KDTRLAFGEL AAWVRQQVPA RVVALTGSSG KTSVKEMTAA 
ILSQCGNTLY TAGNLNNDIG VPMTLLRLTP EYDYAVIELG ANHQGEIVWT VSLTRPEAAL 
VNNLAAAHLE GFGSLAGVAK AKGEIFSGLP ENGIAIMNAD NNDWLNWQSV IGSRKVWRFS 
PNAANSDFTA TNIHVTSHGT EFTLQTPTGS VDVLLPLPGR HNIANALAAA ALSMSVGATL 
DAIKAGLANL KAVPGRLFPI QLAENQLLLD DSYNANVGSM TAAVQVLAEM PGYRVLVVGD 
MAELGAESEA CHVQVGEAAK AAGIDRVLSV GKQSHAISTA SGVGEHFAEK TALITRLKSL 
IAEQQVITIL VKGSRSAAME EVVRALQENG TC