Gene ECD_04101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_04101
Symbol	mpl
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	4367400
End bp	4368773
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	55%
IMG OID
Product	UDP-N-acetylmuramate:L-alanyl-gamma-D-glutamyl- meso-diaminopimelate ligase
Protein accession	ACT45890
Protein GI	253980220
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCATTC ATATTTTAGG AATTTGTGGC ACATTTATGG GCGGTCTGGC GATGCTGGCG 
CGCCAGTTAG GCCATGAAGT AACGGGTTCG GACGCCAATG TGTATCCGCC GATGAGCACC 
TTACTTGAGA AGCAAGGCAT TGAGCTGATT CAGGGTTACG ATGCCAGCCA GCTCGATCCG 
CAGCCGGATC TGGTGATTAT TGGCAACGCC ATGACCCGTG GAAATCCGTG TGTGGAAGCG 
GTACTGGAAA AAAACATCCC TTATATGTCA GGTCCACAGT GGCTGCACGA TTTTGTGCTG 
CGCGACCGCT GGGTGCTGGC CGTTGCCGGT ACACACGGCA AAACTACCAC CGCGGGAATG 
GCGACCTGGA TTCTGGAACA GTGCGGTTAC AAACCGGGAT TTGTGATCGG CGGTGTGCCG 
GGGAACTTTG AGGTTTCGGC GCGTCTGGGC GAAAGCGACT TCTTTGTTAT CGAAGCGGAT 
GAGTATGACT GCGCCTTCTT CGACAAACGC TCTAAATTTG TCCATTACTG CCCGCGTACG 
CTGATCCTCA ACAACCTTGA GTTCGATCAC GCCGATATCT TTGACGACCT GAAAGCGATC 
CAGAAACAGT TCCACCATCT GGTGCGTATC GTTCCGGGGC AGGGCCGTAT TATCTGGCCG 
GAAAATGACA TCAACCTGAA ACAGACCATG GCGATGGGCT GCTGGAGCGA GCAGGAGCTG 
GTGGGTGAGC AGGGTCACTG GCAGGCGAAA AAGCTGACCA CCGATGCTTC CGAATGGGAA 
GTTTTGCTGG ATGGCGAAAA AGTGGGCGAA GTGAAATGGT CGCTGGTAGG CGAACATAAT 
ATGCACAATG GCCTGATGGC GATTGCAGCG GCTCGCCATG TTGGTGTAGC GCCGGCAGAT 
GCCGCTAACG CGCTGGGTTC GTTTATTAAT GCTCGTCGCC GTCTGGAGTT GCGTGGTGAA 
GCGAATGGTG TGACGGTATA TGACGATTTT GCCCATCACC CGACGGCGAT TCTGGCAACG 
CTTGCGGCGC TGCGTGGCAA AGTTGGTGGT ACGGCGCGCA TTATTGCTGT GCTGGAACCG 
CGCTCGAATA CCATGAAAAT GGGGATCTGC AAAGACGATC TGGCACCTTC ATTAGGTCGT 
GCCGATGAAG TCTTCCTGCT GCAACCGGCG CATATTCCGT GGCAGGTGGC AGAAGTGGCA 
GAAGCCTGCG TTCAGCCTGC ACACTGGAGT GGCGATGTGG ATACGCTGGC AGATATGGTG 
GTGAAAACCG CTCAGCCTGG CGACCATATT CTGGTGATGA GCAACGGCGG TTTTGGTGGG 
ATCCATCAGA AACTGCTGGA TGGTCTGGCG AAGAAGGCGG AAGCTGCGCA GTAA

Protein sequence

MRIHILGICG TFMGGLAMLA RQLGHEVTGS DANVYPPMST LLEKQGIELI QGYDASQLDP 
QPDLVIIGNA MTRGNPCVEA VLEKNIPYMS GPQWLHDFVL RDRWVLAVAG THGKTTTAGM 
ATWILEQCGY KPGFVIGGVP GNFEVSARLG ESDFFVIEAD EYDCAFFDKR SKFVHYCPRT 
LILNNLEFDH ADIFDDLKAI QKQFHHLVRI VPGQGRIIWP ENDINLKQTM AMGCWSEQEL 
VGEQGHWQAK KLTTDASEWE VLLDGEKVGE VKWSLVGEHN MHNGLMAIAA ARHVGVAPAD 
AANALGSFIN ARRRLELRGE ANGVTVYDDF AHHPTAILAT LAALRGKVGG TARIIAVLEP 
RSNTMKMGIC KDDLAPSLGR ADEVFLLQPA HIPWQVAEVA EACVQPAHWS GDVDTLADMV 
VKTAQPGDHI LVMSNGGFGG IHQKLLDGLA KKAEAAQ