Gene ECH74115_0223 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0223
Symbol	mltD
ID	6969108
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	236130
End bp	237350
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	52%
IMG OID	643384297
Product	membrane-bound lytic murein transglycosylase D
Protein accession	YP_002268814
Protein GI	209397531
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0741] Soluble lytic murein transglycosylase and related regulatory proteins (some contain LysM/invasin domains)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGATG GGACGTCTAT CGCGCCAGAT GGTGACTTGT GGGCTTTCAT TGGCGACGAG 
CTAAAGATGG GAATTCCGGA AAATGACCGG ATTCGCGAAC AGAAACAGAA ATATTTACGC 
AATAAGAGCT ATCTCCACGA TGTAACTTTA CGGGCAGAGC CGTATATGTA CTGGATAGCC 
GGGCAAGTTA AAAAACGTAA CATGCCTATG GAACTGGTAC TACTACCCAT AGTGGAGAGC 
GCTTTTGATC CTCACGCAAC GTCTGGCGCC AATGCCGCAG GCATCTGGCA GATCATTCCG 
AGCACGGGGC GCAATTATGG TTTGAAACAG ACCCGCAATT ATGACGCGCG TCGCGATGTT 
GTTGCTTCAA CAACTGCCGC GCTGAATATG ATGCAGCGTC TGAACAAAAT GTTTGATGGC 
GACTGGCTTC TGACCGTAGC GGCTTATAAC AGCGGCGAAG GTCGGGTCAT GAAGGCAATT 
AAAACGAACA AAGCGCGTGG GAAATCCACG GACTTCTGGT CGTTACCGTT GCCGCAGGAA 
ACGAAGCAGT ACGTGCCTAA AATGCTGGCA TTGAGTGATA TTCTCAAAAA CAGCAAGCGT 
TATGGCGTAC GTCTGCCAAC GACCGATGAA AGCCGTGCTC TGGCGCGTGT GCACCTGAGT 
AGCCCGGTTG AAATGGCGAA GGTTGCAGAT ATGGCGGGGA TTTCCGTCAG CAAGCTGAAG 
ACATTCAACG CTGGCGTGAA AGGCTCCACG CTGGGCGCAA GTGGTCCGCA GTACGTGATG 
GTGCCAAAGA AGCATGCAGA TCAACTGCGT GAATCTCTGG CTTCAGGCGA AATTGCTGCT 
GTACAGTCGA CGCTGGTTGC CGACAATACG CCGCTTAACA GCCGTGTTTA CACCGTACGC 
TCTGGCGACA CGCTTTCAAG TATCGCTTCA CGTCTCGGCG TAAGCACCAA AGATTTGCAG 
CAGTGGAACA AACTGCGCGG CTCTAAGCTG AAACCAGGCC AAAGTCTGAC GATTGGCGCA 
GGTAGTAGCG CACAGCGGTT GGCAAACAAC AGCGATAGCA TTACGTATCG TGTGCGCAAA 
GGCGATTCGC TTTCAAGCAT TGCTAAACGC CACGGCGTGA ACATCAAAGA TGTGATGCGC 
TGGAACAGCG ATACTGCGAA TCTGCAACCA GGCGATAAGC TGACGTTGTT TGTGAAAAAC 
AACAGCATGC CAGACTCCTG A

Protein sequence

MDDGTSIAPD GDLWAFIGDE LKMGIPENDR IREQKQKYLR NKSYLHDVTL RAEPYMYWIA 
GQVKKRNMPM ELVLLPIVES AFDPHATSGA NAAGIWQIIP STGRNYGLKQ TRNYDARRDV 
VASTTAALNM MQRLNKMFDG DWLLTVAAYN SGEGRVMKAI KTNKARGKST DFWSLPLPQE 
TKQYVPKMLA LSDILKNSKR YGVRLPTTDE SRALARVHLS SPVEMAKVAD MAGISVSKLK 
TFNAGVKGST LGASGPQYVM VPKKHADQLR ESLASGEIAA VQSTLVADNT PLNSRVYTVR 
SGDTLSSIAS RLGVSTKDLQ QWNKLRGSKL KPGQSLTIGA GSSAQRLANN SDSITYRVRK 
GDSLSSIAKR HGVNIKDVMR WNSDTANLQP GDKLTLFVKN NSMPDS