Gene EcSMS35_3106 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3106
Symbol	mltC
ID	6143122
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	3191239
End bp	3192318
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	51%
IMG OID	641617974
Product	murein transglycosylase C
Protein accession	YP_001745125
Protein GI	170683301
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0741] Soluble lytic murein transglycosylase and related regulatory proteins (some contain LysM/invasin domains)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.00368993
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAAAAT ATCTCGCGCT GGCTTTGATT GCGCCGTTGC TCATCTCCTG TTCGACGACC 
AAAAAAGGCG ATACCTATAA CGAAGCCTGG GTCAAAGACA CCAACGGTTT TGATATTCTG 
ATGGGGCAAT TTGCCCACAA TATTGAGAAC ATCTGGGGAT TCAAAGAGGT GGTGATCGCC 
GGTCCTAAGG ACTACGTGAA ATACACCGAT CAATATCAGA CCCGCAGCCA CATCAACTTC 
GATGACGGTA CGATTACTAT CGAAACCATC GCCGGGACAG AACCTGCCGC GCATCTGCGC 
CGGGCAATTA TCAAAACGTT GCTGATGGGT GACGATCCGA GTTCGGTCGA TCTCTATTCC 
GACGTTGATG ACATTACGAT TTCGAAAGAA CCTTTCCTTT ACGGTCAGGT GGTGGACAAC 
ACCGGGCAGC CGATTCGCTG GGAAGGTCGC GCGAGCAACT TCGCGGATTA TCTGCTGAAA 
AACCGTCTGA AAAGCCGTAG CAACGGGCTA CGAATCATCT ATAGCGTCAC CATTAACATG 
GTGCCAAACC ACCTTGATAA ACGTGCGCAC AAATATCTCG GCATGGTCCG CCAGGCGTCA 
CGGAAATATG GCGTTGATGA GTCGCTGATT CTGGCGATTA TGCAGACCGA GTCATCCTTT 
AACCCGTATG CGGTCAGCCG TTCCGATGCG CTGGGATTAA TGCAGGTGGT ACAACATACT 
GCCGGGAAAG ATGTGTTCCG CTCGCAGGGG AAATCCGGCA CGCCGAGCCG CAGTTTCTTG 
TTTGATCCTG CCAGCAATAT TGATATCGGC ACCGCGTATC TGGCGATGCT GAACAATGTT 
TATCTCGGCG GAATTGATAA CCCAACGTCG CGGCGTTATG CCGTCATCAC CGCCTATAAC 
GGCGGTGCAG GCAGCGTGCT GCGAGTCTTT TCGAATGACA AGATTCAGGC GGCCAATATT 
ATTAACACCA TGACGCCGGG CGATGTTTAT CAAACGCTGA CGACCCGCCA TCCCTCTGCG 
GAATCTCGCC GTTATCTTTA TAAAGTGAAT ACCGCGCAAA AATCCTACCG CCGCCGATAA

Protein sequence

MKKYLALALI APLLISCSTT KKGDTYNEAW VKDTNGFDIL MGQFAHNIEN IWGFKEVVIA 
GPKDYVKYTD QYQTRSHINF DDGTITIETI AGTEPAAHLR RAIIKTLLMG DDPSSVDLYS 
DVDDITISKE PFLYGQVVDN TGQPIRWEGR ASNFADYLLK NRLKSRSNGL RIIYSVTINM 
VPNHLDKRAH KYLGMVRQAS RKYGVDESLI LAIMQTESSF NPYAVSRSDA LGLMQVVQHT 
AGKDVFRSQG KSGTPSRSFL FDPASNIDIG TAYLAMLNNV YLGGIDNPTS RRYAVITAYN 
GGAGSVLRVF SNDKIQAANI INTMTPGDVY QTLTTRHPSA ESRRYLYKVN TAQKSYRRR