Gene EcSMS35_1559 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1559
Symbol	anmK
ID	6145602
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1543254
End bp	1544363
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	55%
IMG OID	641616436
Product	anhydro-N-acetylmuramic acid kinase
Protein accession	YP_001743614
Protein GI	170680769
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG2377] Predicted molecular chaperone distantly related to HSP70-fold metalloproteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	64
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATCGG GTCGCTTTAT TGGCGTTATG TCAGGCACCA GCCTTGATGG TGTTGATGTT 
GTGTTGGCGA CAATTGATGA ACACCGGGTC GCACAGCTGG CAAGTTTGAG CTGGCCGATC 
CCGGTGTCTC TGAAACAGGC TGTACTGGAT ATTTGCCAGG GCCAGCAGCT TACACTTTCG 
CAGTTTGGAC AGCTTGATAC TCAACTCGGG CGACTTTTTG CTGATGCGGT CAATGCCTTG 
CTTAAGGAAC AAAACCTGCA GGCGAGAGAT ATCGTTGCGA TCGGCTGTCA CGGTCAAACC 
GTCTGGCATG AACCGACGGG CGTGGCACCA CACACTTTAC AGATTGGCGA TAACAATCAA 
ATTGTGGCAC GCACCGGAAT TACGGTTGTC GGTGATTTTC GCCGTCGCGA TATTGCCTTG 
GGAGGACAAG GCGCACCGCT GGTACCTGCG TTCCATCATG CGCTGCTGGC TCACCCAACC 
GAGCGACGAA TGGTGCTCAA TATTGGTGGC ATTGCCAATC TGTCACTGCT CATTCCTGGG 
CAGCCGGTAG GGGGCTACGA TACCGGCCCT GGTAACATGC TGATGGATGC CTGGATCTGG 
CGTCAGGCAG GTAAACCTTA CGATAAAGAT GCCGAGTGGG CACGGGCGGG TAAAGTCATT 
CTCCCACTGC TGCAAAATAT GCTCAGCGAC CCATATTTCT CGCAACCTGC ACCGAAAAGT 
ACCGGACGCG AATACTTTAA CTACGGCTGG CTGGAGCGCC ATTTGCGCCA TTTTCCGGGT 
GTTGATCCCC GAGATGTACA GGCGACACTG GCAGAACTCA CCGCCGTGAC CATTTCTGAA 
CAAGTTTTGT TGAGCGGTGG CTGCGAACGA TTGATGGTAT GTGGTGGAGG AAGTCGTAAT 
CCGCTACTCA TGGCGCGTCT GGCGGCATTA CTGCCAGGCA CAGAAGTCAC CACCACCGAT 
GCCGTTGGCA TTAGTGGCGA TGACATGGAA GCATTGGCTT TCGCCTGGCT TGCCTGGCGA 
ACGCTGGCGG GATTACCAGG AAATCTGCCT TCCGTCACTG GCGCAAGCCA GGAGACGGTA 
CTGGGGGCTA TTTTCCCCGC TAACCTGTGA

Protein sequence

MKSGRFIGVM SGTSLDGVDV VLATIDEHRV AQLASLSWPI PVSLKQAVLD ICQGQQLTLS 
QFGQLDTQLG RLFADAVNAL LKEQNLQARD IVAIGCHGQT VWHEPTGVAP HTLQIGDNNQ 
IVARTGITVV GDFRRRDIAL GGQGAPLVPA FHHALLAHPT ERRMVLNIGG IANLSLLIPG 
QPVGGYDTGP GNMLMDAWIW RQAGKPYDKD AEWARAGKVI LPLLQNMLSD PYFSQPAPKS 
TGREYFNYGW LERHLRHFPG VDPRDVQATL AELTAVTISE QVLLSGGCER LMVCGGGSRN 
PLLMARLAAL LPGTEVTTTD AVGISGDDME ALAFAWLAWR TLAGLPGNLP SVTGASQETV 
LGAIFPANL