Gene EcSMS35_0225 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0225
Symbol	mltD
ID	6144705
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	241941
End bp	243161
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	52%
IMG OID	641615124
Product	membrane-bound lytic murein transglycosylase D
Protein accession	YP_001742334
Protein GI	170681258
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0741] Soluble lytic murein transglycosylase and related regulatory proteins (some contain LysM/invasin domains)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.459174
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGATG GGACGTCTAT CGCGCCAGAT GGTGACTTGT GGGCTTTCAT TGGCGACGAG 
CTAAAGATGG GAATTCCGGA AAACGACCGG ATTCGCGAAC AGAAACAGAA ATATTTACGC 
AATAAGAGCT ATCTCCACGA TGTAACTTTA CGGGCAGAGC CGTATATGTA CTGGATAGCC 
GGGCAAGTTA AAAAACGTAA CATGCCTATG GAACTGGTAC TACTACCCAT AGTGGAGAGC 
GCTTTTGATC CTCACGCAAC GTCTGGCGCC AATGCCGCGG GCATCTGGCA GATCATTCCG 
AGCACGGGGC GCAATTATGG TTTGAAACAG ACCCGCAATT ATGACGCGCG TCGCGATGTT 
GTTGCTTCAA CAACTGCCGC GCTGAACATG ATGCAGCGTC TGAACAAGAT GTTTGACGGC 
GACTGGCTTC TGACCGTAGC GGCTTATAAC AGCGGCGAAG GTCGGGTCAT GAAGGCAATT 
AAAACGAACA AAGCGCGTGG GAAATCCACG GACTTCTGGT CGTTACCGTT GCCGCAGGAA 
ACGAAGCAGT ACGTGCCTAA AATGCTGGCA TTGAGTGATA TTCTCAAAAA CAGCAAGCGT 
TATGGCGTAC GTCTGCCAAC GACCGATGAA AGCCGTGCTC TGGCGCGTGT GCACCTGAGC 
AGCCCGGTTG AAATGGCGAA GGTTGCAGAT ATGGCGGGGA TTTCCGTCAG CAAGCTGAAG 
ACATTCAACG CTGGCGTGAA AGGCTCCACG CTGGGCGCAA GTGGTCCGCA GTACGTGATG 
GTGCCAAAGA AGCATGCAGA TCAACTGCGT GAATCTCTGG CTTCAGGCGA AATTGCTGCT 
GTACAGTCGA CGCTGGTTGC CGACAATACG CCGCTTAACA GCCGTGTTTA CACCGTACGC 
TCTGGCGACA CGCTTTCAAG TATCGCTTCA CGTCTCGGCG TAAGCACCAA AGATTTGCAG 
CAGTGGAACA AACTGCGCGG ATCTAAGCTG AAGCCAGGCC AAAGTTTGAC GATTGGTGCA 
GGCAGTAGCG CACAGCGACT GGCAAACAAC AGCGATAGCA TTACGTATCG TGTGCGCAAA 
GGCGATTCGC TTTCAAGCAT TGCTAAACGC CACGGCGTGA ACATCAAAGA TGTAATGCGC 
TGGAACAGCG ATACTGCGAA TCTGCAACCA GGCGATAAGC TGACGTTGTT TGTGAAAAAC 
AACAGCATGC CAGACTCCTG A

Protein sequence

MDDGTSIAPD GDLWAFIGDE LKMGIPENDR IREQKQKYLR NKSYLHDVTL RAEPYMYWIA 
GQVKKRNMPM ELVLLPIVES AFDPHATSGA NAAGIWQIIP STGRNYGLKQ TRNYDARRDV 
VASTTAALNM MQRLNKMFDG DWLLTVAAYN SGEGRVMKAI KTNKARGKST DFWSLPLPQE 
TKQYVPKMLA LSDILKNSKR YGVRLPTTDE SRALARVHLS SPVEMAKVAD MAGISVSKLK 
TFNAGVKGST LGASGPQYVM VPKKHADQLR ESLASGEIAA VQSTLVADNT PLNSRVYTVR 
SGDTLSSIAS RLGVSTKDLQ QWNKLRGSKL KPGQSLTIGA GSSAQRLANN SDSITYRVRK 
GDSLSSIAKR HGVNIKDVMR WNSDTANLQP GDKLTLFVKN NSMPDS