Gene EcHS_A1716 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1716
Symbol	anmK
ID	5593048
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	1740446
End bp	1741555
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	55%
IMG OID	640920864
Product	anhydro-N-acetylmuramic acid kinase
Protein accession	YP_001458420
Protein GI	157161102
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG2377] Predicted molecular chaperone distantly related to HSP70-fold metalloproteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	0.213735
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATCGG GCCGCTTTAT TGGCGTTATG TCAGGCACCA GCCTTGATGG TGTTGATGTT 
GTGTTGGCGA CAATTGATGA ACACCGGGTC GCACAGCTGG CAAGTTTGAG TTGGCCGATC 
CCGGTATCTC TGAAACAGGC TGTACTGGAT ATTTGCCAGG GCCAGCAGCT TACACTTTCG 
CAGTTTGGAC AGCTTGATAC TCAACTCGGG CGACTTTTTG CTGATGCGGT CAATGCCTTG 
CTTAAGGAAC AAAATCTGCA GGCAAGAGAT ATAGTTGCGA TCGGTTGTCA CGGTCAAACC 
GTCTGGCATG AACCGACGGG CGTGGCACCA CACACTTTAC AGATTGGCGA TAACAATCAA 
ATTGTGGCAC GCACCGGAAT TACGGTTGTC GGTGATTTTC GCCGTCGCGA TATTGCCTTG 
GGAGGACAAG GCGCACCGCT GGTACCTGCG TTCCATCATG CGCTGCTGGC TCACCCAACC 
GAGCGACGAA TGGTGCTCAA TATTGGCGGC ATCGCCAATC TGTCACTGCT CATTCCTGGG 
CAGCCGGTTG GGGGCTACGA TACCGGTCCT GGTAACATGC TGATGGATGC CTGGATCTGG 
CGTCAGGCCG GTAAACCTTA CGATAAAGAT GCCGAGTGGG CACGGGCGGG TAAAGTTATT 
CTCCCACTGC TGCAAAATAT GCTCAGCGAC CCGTATTTCT CGCAACCTGC ACCGAAAAGC 
ACCGGACGCG AATACTTTAA CTATGGTTGG CTGGAGCGCC ATTTGCGCCA TTTTCCGGGT 
GTTGATCCCC GAGATGTGCA GGCGACACTG GCAGAACTCA CCGCCGTGAC CATTTCTGAA 
CAAGTTTTGT TGAGCGGTGG CTGCGAACGA TTGATGGTAT GTGGTGGAGG TAGTCGTAAT 
CCGCTACTCA TGGCGCGTCT GGCGGCATTA CTGCCAGGCA CAGAAGTCAC CACCACCGAT 
GCCGTTGGCA TTAGTGGCGA TGACATGGAA GCATTGGCTT TCGCCTGGCT TGCCTGGCGG 
ACGCTGGCGG GATTACCAGG AAATCTGCCT TCCGTCACTG GCGCAAGCCA GGAGACGGTA 
CTGGGGGCTA TTTTCCCCGC TAACCCGTGA

Protein sequence

MKSGRFIGVM SGTSLDGVDV VLATIDEHRV AQLASLSWPI PVSLKQAVLD ICQGQQLTLS 
QFGQLDTQLG RLFADAVNAL LKEQNLQARD IVAIGCHGQT VWHEPTGVAP HTLQIGDNNQ 
IVARTGITVV GDFRRRDIAL GGQGAPLVPA FHHALLAHPT ERRMVLNIGG IANLSLLIPG 
QPVGGYDTGP GNMLMDAWIW RQAGKPYDKD AEWARAGKVI LPLLQNMLSD PYFSQPAPKS 
TGREYFNYGW LERHLRHFPG VDPRDVQATL AELTAVTISE QVLLSGGCER LMVCGGGSRN 
PLLMARLAAL LPGTEVTTTD AVGISGDDME ALAFAWLAWR TLAGLPGNLP SVTGASQETV 
LGAIFPANP