Gene EcolC_3778 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3778
Symbol
ID	6066641
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4133309
End bp	4134682
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	55%
IMG OID	641603191
Product	UDP-N-acetylmuramate
Protein accession	YP_001726710
Protein GI	170021756
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0773] UDP-N-acetylmuramate-alanine ligase
TIGRFAM ID	[TIGR01081] UDP-N-acetylmuramate:L-alanyl-gamma-D-glutamyl-meso-diaminopimelate ligase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCATTC ATATTTTAGG AATTTGTGGC ACGTTTATGG GCGGTCTGGC GATGCTGGCG 
CGCCAGTTAG GCCATGAAGT AACGGGTTCG GACGCCAATG TGTATCCGCC GATGAGCACC 
TTACTTGAGA AGCAAGGCAT TGAACTGATT CAGGGTTACG ATGCCAGCCA GCTCGATCCG 
CAGCCGGATC TGGTGATTAT TGGCAACGCC ATGACCCGTG GAAATCCGTG TGTGGAAGCG 
GTACTGGAAA AAAACATCCC TTATATGTCA GGTCCACAGT GGCTGCACGA TTTTGTGCTG 
CGCGACCGCT GGGTGCTGGC CGTTGCCGGT ACACATGGCA AAACCACCAC CGCGGGAATG 
GCGACCTGGA TTCTGGAACA GTGCGGTTAC AAACCGGGAT TTGTGATCGG CGGTGTGCCG 
GGGAACTTTG AGGTTTCGGC GCGTCTGGGC GAAAGCAACT TCTTTGTTAT CGAAGCGGAT 
GAGTATGACT GCGCCTTCTT CGACAAACGC TCTAAATTTG TTCATTACTG CCCGCGTACG 
CTGATCCTCA ACAACCTTGA GTTCGATCAC GCCGATATCT TTGACGACCT GAAAGCGATC 
CAGAAACAGT TCCACCATCT GGTGCGTATC GTTCCGGGGC AGGGCCGTAT TATCTGGCCA 
GAAAACGACA TCAACCTGAA ACAGACCATG GCGATGGGCT GCTGGAGCGA GCAGGAGCTG 
GTGGGCGAGC AAGGTCACTG GCAGGCGAAA AAGCTGACCA CCGATGCTTC CGAATGGGAA 
GTCTTGCTGG ATGGCGAAAA AGTGGGCGAA GTGAAATGGT CGCTGGTAGG CGAACATAAT 
ATGCACAATG GCCTGATGGC GATTGCGGCG GCTCGCCATG TTGGTGTAGC GCCGGCAGAT 
GCCGCTAACG CGCTGGGTTC GTTTATTAAC GCTCGCCGCC GTCTGGAGTT GCGTGGTGAA 
GCGAATGGCG TAACGGTATA TGACGATTTT GCCCATCACC CGACGGCGAT TCTGGCAACG 
CTTGCGGCGC TGCGTGGCAA AGTTGGCGGT ACGGCGCGCA TTATTGCTGT GCTGGAACCG 
CGCTCGAATA CCATGAAAAT GGGGATCTGC AAAGACGATC TGGCACCTTC ATTAGGTCGT 
GCCGATGAAG TCTTCCTGCT GCAACCAGCG CATATTCCGT GGCAGGTGGC AGAAGTGGCA 
GAAGCCTGCG TTCAGCCTGC ACACTGGAGT GGCGATGTGG ATACGCTGGC AGATATGGTG 
GTGAAAACCG CTCAGCCTGG CGACCATATT CTGGTGATGA GCAACGGCGG TTTTGGTGGG 
ATCCATCAGA AACTGCTGGA TGGTCTGGCG AAGAAGGCGG AAGCTGCGCA GTAA

Protein sequence

MLIHILGICG TFMGGLAMLA RQLGHEVTGS DANVYPPMST LLEKQGIELI QGYDASQLDP 
QPDLVIIGNA MTRGNPCVEA VLEKNIPYMS GPQWLHDFVL RDRWVLAVAG THGKTTTAGM 
ATWILEQCGY KPGFVIGGVP GNFEVSARLG ESNFFVIEAD EYDCAFFDKR SKFVHYCPRT 
LILNNLEFDH ADIFDDLKAI QKQFHHLVRI VPGQGRIIWP ENDINLKQTM AMGCWSEQEL 
VGEQGHWQAK KLTTDASEWE VLLDGEKVGE VKWSLVGEHN MHNGLMAIAA ARHVGVAPAD 
AANALGSFIN ARRRLELRGE ANGVTVYDDF AHHPTAILAT LAALRGKVGG TARIIAVLEP 
RSNTMKMGIC KDDLAPSLGR ADEVFLLQPA HIPWQVAEVA EACVQPAHWS GDVDTLADMV 
VKTAQPGDHI LVMSNGGFGG IHQKLLDGLA KKAEAAQ