Gene Mlg_0436 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0436
Symbol	anmK
ID	4268289
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	483803
End bp	484954
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	73%
IMG OID	638125166
Product	anhydro-N-acetylmuramic acid kinase
Protein accession	YP_741280
Protein GI	114319597
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG2377] Predicted molecular chaperone distantly related to HSP70-fold metalloproteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.231564
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.0404466
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACGCCG GAGCGGCATC GGCCCCGCGC GACGGGCTCT ACCTGGGGCT GATCTCCGGC 
ACCAGCATCG ATGCGGTGGA CGCCGCCCTG GTGGAGATCC GGGGCGGGCA GCCGCGGTTG 
TGTCGGGCCC TGGGTCACCC CATCCCCGGG CCATTGGCTT CCGCATTGCA CCGGGTGGAT 
GCCCAAACCC CCCTCGACAC CCTGCTCGAT CTGGACCAGC AGGTGGCCCG GCTGCACGCG 
GAGGCCGCCC GCCGGTTGCT GTCCGAGGCC AAAACCGGTG CCGCGGAGGT CATCGCCATC 
GGCAGTCACG GGCAAACGGT TTATCACCGC CCCCACGGCC CCTACCCCAC CACCGTCCAA 
TTGGGGGACC CCTCCCGGCT CGCGGCGGAG ACCGGGATCA CCACGGTCGC CGACTTCCGC 
CGCCGGGACA TGGCCCTGGG TGGCCAGGGC GCGCCCCTGG TTCCGGCCTT TCACGCCGCT 
TGCCTGCGGC AAGCCGGGGA GGATCGCGCG GTGCTCAACC TGGGGGGTAT CGCCAACCTC 
ACGCTCCTGC CAGGCACCGA CACGGCACCG GTCACCGGGT TCGACACCGG CCCCGCCAAC 
ACCCTGCTCG ACGCCTGGTT CCGGCAGCAC CGGGACGGGA CCTACGACCG GGATGGGGCC 
TGGGCCGCGG GGGGCGCGCT GCACACCGGG CTGCTCCGGC GGCTGCTGAA CGATGACTAC 
CTGAAACGGC CACCGCCGAA AAGCACCGGC CCGGAATACT TCAGCCCCGA CTGGCTGCAC 
CGACAACTGG ATGCGTTACC GGGCGCCCCA CCGGCTCCGC AGGACGTGCA ACGAACCCTG 
CTGGCCTTTA CCGCCCAGAG CGCGGTTGCA GCGCTGGCCG AGGCCCTGCC CGGTGTGCGC 
CAGCTGTATA TCTGTGGCGG CGGCATCCAC AACACCGCCT TGTGGCGGGC GCTGGCGGCG 
GCGCTGGCGT CCCGGTGCCC CGGCTGCCAG CTGACCCCCA CCACGGAGGC CGGACTCGAC 
CCGGACTGGC TGGAGGCGAT GGCCTTCGCC TGGCTGGCCT ACCGAACCCT CGCCGGCCTG 
CCCGGCAACC TGCCCGAGGT CACCGGGGCG CGCCAGGCCG CGCCGCTGGG TGGGATCTTC 
CCCGCGGGCT GA

Protein sequence

MNAGAASAPR DGLYLGLISG TSIDAVDAAL VEIRGGQPRL CRALGHPIPG PLASALHRVD 
AQTPLDTLLD LDQQVARLHA EAARRLLSEA KTGAAEVIAI GSHGQTVYHR PHGPYPTTVQ 
LGDPSRLAAE TGITTVADFR RRDMALGGQG APLVPAFHAA CLRQAGEDRA VLNLGGIANL 
TLLPGTDTAP VTGFDTGPAN TLLDAWFRQH RDGTYDRDGA WAAGGALHTG LLRRLLNDDY 
LKRPPPKSTG PEYFSPDWLH RQLDALPGAP PAPQDVQRTL LAFTAQSAVA ALAEALPGVR 
QLYICGGGIH NTALWRALAA ALASRCPGCQ LTPTTEAGLD PDWLEAMAFA WLAYRTLAGL 
PGNLPEVTGA RQAAPLGGIF PAG