Gene EcSMS35_3485 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3485
Symbol	murA
ID	6144571
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3561848
End bp	3563107
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	53%
IMG OID	641618314
Product	UDP-N-acetylglucosamine 1-carboxyvinyltransferase
Protein accession	YP_001745461
Protein GI	170679709
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0766] UDP-N-acetylglucosamine enolpyruvyl transferase
TIGRFAM ID	[TIGR01072] UDP-N-acetylglucosamine 1-carboxyvinyltransferase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.027658
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATAAAT TTCGTGTTCA GGGGCCAACG AAGCTCCAGG GCGAAGTCAC AATTTCCGGC 
GCTAAAAATG CTGCTCTGCC TATCCTTTTT GCCGCACTAC TGGCGGAAGA ACCGGTAGAG 
ATCCAGAACG TCCCGAAACT AAAAGACGTC GATACATCAA TGAAGCTGCT AAGCCAGCTG 
GGTGCGAAAG TAGAACGTAA TGGTTCTGTG CATATTGATG CCCGCGACGT TAATGTATTC 
TGCGCACCTT ACGATCTGGT TAAAACCATG CGTGCTTCTA TCTGGGCGCT GGGGCCGCTG 
GTAGCGCGCT TTGGTCAGGG GCAAGTTTCA CTGCCTGGCG GTTGTACGAT TGGTGCACGT 
CCGGTTGATC TACACATTTC TGGTCTCGAA CAATTAGGCG CGACCATCAA ACTGGAAGAA 
GGTTACGTTA AAGCTTCCGT CGATGGTCGT TTGAAAGGCG CACATATCGT GATGGATAAA 
GTCAGCGTTG GCGCAACGGT GACCATCATG TGTGCTGCAA CCCTGGCCGA AGGCACCACG 
ATTATTGAAA ACGCAGCGCG TGAACCGGAA ATCGTCGATA CCGCGAACTT CCTGATTACG 
CTGGGTGCGA AAATTAGCGG TCAGGGCACC GATCGTATCG TCATTGAAGG TGTGGAACGT 
TTAGGCGGCG GTGTCTATCG CGTGCTGCCG GATCGTATCG AAACCGGTAC TTTCCTGGTG 
GCGGCGGCGA TCTCTCGCGG CAAAATTATC TGCCGTAACG CGCAGCCAGA TACTCTGGAC 
GCCGTGCTGG CGAAACTGCG TGACGCTGGA GCGGACATCG AAGTCGGCGA AGACTGGATT 
AGCCTGGATA TGCATGGCAA ACGTCCGAAG GCTGTTAACG TACGTACCGC GCCGCATCCG 
GCATTCCCGA CCGATATGCA GGCCCAGTTC ACGCTGTTGA ACCTGGTGGC AGAAGGGACC 
GGATTCATCA CCGAAACGGT CTTTGAAAAC CGCTTTATGC ATGTGCCAGA GCTGAGCCGT 
ATGGGCGCGC ACGCCGAAAT CGAAAGCAAT ACCGTTATTT GTCACGGTGT TGAAAAACTT 
TCTGGCGCAC AGGTTATGGC AACCGATCTA CGTGCATCAG CAAGCCTGGT GCTGGCTGGC 
TGTATTGCGG AAGGGACGAC GGTAGTTGAT CGTATTTATC ACATCGATCG TGGCTACGAA 
CGCATTGAAG ACAAACTGCG CGCTTTAGGT GCAAATATTG AGCGTGTGAA AGGCGAGTAA

Protein sequence

MDKFRVQGPT KLQGEVTISG AKNAALPILF AALLAEEPVE IQNVPKLKDV DTSMKLLSQL 
GAKVERNGSV HIDARDVNVF CAPYDLVKTM RASIWALGPL VARFGQGQVS LPGGCTIGAR 
PVDLHISGLE QLGATIKLEE GYVKASVDGR LKGAHIVMDK VSVGATVTIM CAATLAEGTT 
IIENAAREPE IVDTANFLIT LGAKISGQGT DRIVIEGVER LGGGVYRVLP DRIETGTFLV 
AAAISRGKII CRNAQPDTLD AVLAKLRDAG ADIEVGEDWI SLDMHGKRPK AVNVRTAPHP 
AFPTDMQAQF TLLNLVAEGT GFITETVFEN RFMHVPELSR MGAHAEIESN TVICHGVEKL 
SGAQVMATDL RASASLVLAG CIAEGTTVVD RIYHIDRGYE RIEDKLRALG ANIERVKGE