Gene EcolC_1989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1989
Symbol	anmK
ID	6068163
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2197073
End bp	2198182
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	55%
IMG OID	641601403
Product	anhydro-N-acetylmuramic acid kinase
Protein accession	YP_001724962
Protein GI	170020008
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG2377] Predicted molecular chaperone distantly related to HSP70-fold metalloproteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00164858
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAATCGG GCCGCTTTAT TGGCGTTATG TCAGGCACCA GCCTTGATGG TGTTGATGTT 
GTGTTGGCGA CAATTGATGA ACACCGGGTC GCACAGCTGG CAAGTTTGAG TTGGCCGATC 
CCGGTATCTC TGAAACAGGC TGTACTGGAT ATTTGCCAGG GCCAGCAGCT TACACTTTCG 
CAGTTTGGAC AGCTTGATAC TCAACTCGGG CGACTTTTTG CTGATGCGGT CAATGCCTTG 
CTTAAGGAAC AAAATCTGCA GGCAAGAGAT ATAGTTGCGA TCGGTTGTCA CGGTCAAACC 
GTCTGGCATG AACCGACGGG CGTGGCACCA CACACTTTAC AGATTGGCGA TAACAATCAA 
ATTGTGGCAC GCACCGGAAT TACGGTTGTC GGTGATTTTC GCCGTCGCGA TATTGCCTTG 
GGAGGACAAG GCGCACCGCT GGTACCTGCG TTCCATCATG CGCTGCTGGC TCACCCAACC 
GAGCGACGAA TGGTGCTCAA TATTGGCGGC ATCGCCAATC TGTCACTGCT CATTCCTGGG 
CAGCCGGTTG GGGGCTACGA TACCGGTCCT GGTAACATGC TGATGGATGC CTGGATCTGG 
CGTCAGGCCG GTAAACCTTA CGATAAAGAT GCCGAGTGGG CACGGGCGGG TAAAGTTATT 
CTCCCACTGC TGCAAAATAT GCTCAGCGAC CCGTATTTCT CGCAACCTGC ACCGAAAAGC 
ACCGGACGCG AATACTTTAA CTATGGTTGG CTGGAGCGCC ATTTGCGCCA TTTTCCGGGT 
GTTGATCCCC GAGATGTGCA GGCGACACTG GCAGAACTCA CCGCCGTGAC CATTTCTGAA 
CAAGTTTTGT TGAGCGGTGG CTGCGAACGA TTGATGGTAT GTGGTGGAGG TAGTCGTAAT 
CCGCTACTCA TGGCGCGTCT GGCGGCATTA CTGCCAGGCA CAGAAGTCAC CACCACCGAT 
GCCGTTGGCA TTAGTGGCGA TGACATGGAA GCATTGGCTT TCGCCTGGCT TGCCTGGCGG 
ACGCTGGCGG GATTACCAGG AAATCTGCCT TCCGTCACTG GCGCAAGCCA GGAGACGGTA 
CTGGGGGCTA TTTTCCCCGC TAACCCGTGA

Protein sequence

MKSGRFIGVM SGTSLDGVDV VLATIDEHRV AQLASLSWPI PVSLKQAVLD ICQGQQLTLS 
QFGQLDTQLG RLFADAVNAL LKEQNLQARD IVAIGCHGQT VWHEPTGVAP HTLQIGDNNQ 
IVARTGITVV GDFRRRDIAL GGQGAPLVPA FHHALLAHPT ERRMVLNIGG IANLSLLIPG 
QPVGGYDTGP GNMLMDAWIW RQAGKPYDKD AEWARAGKVI LPLLQNMLSD PYFSQPAPKS 
TGREYFNYGW LERHLRHFPG VDPRDVQATL AELTAVTISE QVLLSGGCER LMVCGGGSRN 
PLLMARLAAL LPGTEVTTTD AVGISGDDME ALAFAWLAWR TLAGLPGNLP SVTGASQETV 
LGAIFPANP