Gene EcSMS35_2964 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2964
Symbol	amiC1
ID	6145539
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3036388
End bp	3037641
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	53%
IMG OID	641617833
Product	N-acetylmuramoyl-L-alanine amidase AmiC
Protein accession	YP_001744985
Protein GI	170681690
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0860] N-acetylmuramoyl-L-alanine amidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGGAT CCAACACTGC AATCAGCCGT CGTCGTTTAC TGCAAGGCGC GGGTGCCATG 
TGGCTATTGA GCGTAAGTCA GGTCAGCCTG GCTGCGGTCA GCCAGGTCGT GGCGGTGCGC 
GTCTGGCCTG CGTCCAGCTA CACCCGCGTG ACGGTAGAAT CTAATCGTCA GCTGAAATAT 
AAGCAGTTCG CGTTGAGTAA TCCTGAACGC GTGGTGGTGG ATATCGAAGA TGTAAACCTG 
AACTCGGTGC TCAAGGGGAT GGCTGCGCAA ATCCGCGCTG ACGACCCGTT CATCAAGTCG 
GCGCGCGTCG GGCAATTTGA CCCGCAAACC GTACGTATGG TTTTTGAATT AAAGCAAAAC 
GTAAAACCGC AGCTGTTTGC CCTTGCGCCG GTCGCCGGGT TTAAAGAGCG TCTGGTGATG 
GATCTCTATC CTGCCAATGC ACAGGATATG CAGGACCCGC TGCTGGCGCT GCTGGAGGAT 
TACAACAAAG GCGACCTCGA AAAGCAGGTG CCGCCAGCAC AAAGTGGTCC ACAACCGGGT 
AAAGCTGGGC GGGATCGTCC GATTGTCATT ATGCTTGACC CTGGTCACGG TGGCGAAGAC 
TCCGGTGCGG TGGGGAAATA CAAAACACGC GAAAAAGACG TAGTATTGCA AATAGCTCGC 
CGTCTGCGCT CTCTGATCGA GAAAGAGGGC AATATGAAGG TGTACATGAC GCGCAATGAA 
GACATCTTCA TTCCGTTGCA AGTGCGCGTA GCAAAAGCCC AGAAACAGCG TGCTGACTTG 
TTTGTCTCTA TCCATGCCGA CGCCTTTACC AGTCGCCAGC CGAGCGGTTC CTCGGTGTTT 
GCGCTCTCAA CCAAAGGCGC AACCAGTACT GCGGCAAAAT ATCTGGCACA AACCCAGAAC 
GCCTCGGACT TGATTGGTGG CGTAAGCAAA AGCGGTGACC GCTATGTCGA CCACACTATG 
TTCGATATGG TGCAGTCGCT GACCATTGCT GACAGCCTGA AGTTTGGTAA AGCGGTGCTG 
AATAAGCTCG GTAAAATCAA CAAGCTGCAT AAAAATCAAG TTGAACAGGC CGGGTTTGCC 
GTACTAAAGG CACCAGATAT TCCCTCCATT CTGGTCGAAA CGGCGTTTAT CAGTAACGTT 
GAGGAAGAGC GTAAACTGAA AACGGCGACT TTCCAGCAGG AAGTTGCGGA GTCTATTCTT 
GCGGGAATTA AAGCGTATTT TGCCGATGGG GCGACGCTGG CGAGAAGGGG ATAA

Protein sequence

MSGSNTAISR RRLLQGAGAM WLLSVSQVSL AAVSQVVAVR VWPASSYTRV TVESNRQLKY 
KQFALSNPER VVVDIEDVNL NSVLKGMAAQ IRADDPFIKS ARVGQFDPQT VRMVFELKQN 
VKPQLFALAP VAGFKERLVM DLYPANAQDM QDPLLALLED YNKGDLEKQV PPAQSGPQPG 
KAGRDRPIVI MLDPGHGGED SGAVGKYKTR EKDVVLQIAR RLRSLIEKEG NMKVYMTRNE 
DIFIPLQVRV AKAQKQRADL FVSIHADAFT SRQPSGSSVF ALSTKGATST AAKYLAQTQN 
ASDLIGGVSK SGDRYVDHTM FDMVQSLTIA DSLKFGKAVL NKLGKINKLH KNQVEQAGFA 
VLKAPDIPSI LVETAFISNV EEERKLKTAT FQQEVAESIL AGIKAYFADG ATLARRG