Gene EcSMS35_0091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0091
Symbol	murF
ID	6146512
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	101283
End bp	102641
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	55%
IMG OID	641614992
Product	UDP-N-acetylmuramoyl-tripeptide--D-alanyl-D- alanine ligase
Protein accession	YP_001742208
Protein GI	170682834
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0770] UDP-N-acetylmuramyl pentapeptide synthase
TIGRFAM ID	[TIGR01143] UDP-N-acetylmuramoyl-tripeptide--D-alanyl-D-alanine ligase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.667428
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTAGCG TAACCCTTAG CCAACTTACC GATATTCTCA ACGGTGAACT GCAAGGTGCA 
GATATTACCC TTGATGCTGT AACCACTGAC ACGCGAAAAC TGACGCCGGG CTGCCTGTTT 
GTTGCCCTGA AAGGCGAACG TTTCGATGCT CATGATTTTG CCGACCAGGC GAAAGCTGGC 
GGCGCAGGCG CACTACTGGT TAGCCGTCCG CTGGATATCG ATCTGCCGCA GTTAATCGTC 
AAGGATACGC GTCTGGCGTT TGGTGAACTG GCTGCATGGG TTCGCCAGCA AGTTCCGGCG 
CGCGTGGTTG CTCTGACAGG TTCCTCCGGC AAAACATCCG TTAAAGAGAT GACGGCGGCG 
ATTTTAAGCC AGTGCGGCAA CACGCTTTAT ACGGCAGGCA ATCTCAACAA CGACATCGGC 
GTACCGATGA CGCTGTTGCG CTTAACGCCG GAATACGATT ACGCAGTTAT TGAACTTGGC 
GCGAACCATC AGGGCGAAAT TGCCTGGACT GTGAGTCTGA CTCGCCCGGA AGCGGCGCTG 
GTCAACAACC TGGCAGCGGC ACATCTGGAA GGTTTTGGCT CGCTTGCGGG TGTCGCGAAA 
GCGAAAGGTG AAATCTTTAG CGGCCTGCCG GAAAACGGTA TCGCCATCAT GAACGCTGAC 
AACAACGACT GGCTGAACTG GCAGAGCGTA ATTGGCTCAC GCAAAGTGTG GCGTTTCTCA 
CCCAATGCCG CCAACAGCGA TTTCACCGCC ACCAATATCC ATGTGACTTC GCACGGTACG 
GAATTTACCC TGCAAACCCC AACCGGTAGC GTGGATGTTC TGCTGCCGTT GCCGGGGCGT 
CACAATATTG CGAATGCGCT GGCAGCCGCT GCGCTCTCCA TGGCCGTGGG CGCAACGCTT 
GATGCTATCA AAGCGGGGCT GGCAAATCTG AAAGCTGTTC CAGGCCGTCT GTTCCCCATT 
CAACTGGTAG AAAACCAGTT GCTGCTCGAC GACTCCTACA ACGCCAATGT TGGTTCAATG 
ACTGCAGCAG TCCAGGTACT GGCTGAAATG CCGGGCTACC GCGTGCTGGT GGTGGGCGAT 
ATGGCGGAAC TGGGCGCTGA AAGCGAAGCC TGCCATATAC AGGTGGGCGA AGCGGCAAAA 
GCAGCTGGTA TTGACCGCGT GTTAAGCGTG GGCAAACAAA GCCATGCTAT CAGCACCGCC 
AGCGGCGTTG GCGAACATTT TTCCGATAAA ACTGCGCTTA TCGCGCGTCT TAAATCACTG 
ATTGCTGAGC AACAGGTAAT TACGATTTTA GTTAAGGGTT CACGTAGTGC TGCCATGGAA 
GAGGTAGTAC GCGCTTTACA GGAGAATGGG ACATGTTAG

Protein sequence

MISVTLSQLT DILNGELQGA DITLDAVTTD TRKLTPGCLF VALKGERFDA HDFADQAKAG 
GAGALLVSRP LDIDLPQLIV KDTRLAFGEL AAWVRQQVPA RVVALTGSSG KTSVKEMTAA 
ILSQCGNTLY TAGNLNNDIG VPMTLLRLTP EYDYAVIELG ANHQGEIAWT VSLTRPEAAL 
VNNLAAAHLE GFGSLAGVAK AKGEIFSGLP ENGIAIMNAD NNDWLNWQSV IGSRKVWRFS 
PNAANSDFTA TNIHVTSHGT EFTLQTPTGS VDVLLPLPGR HNIANALAAA ALSMAVGATL 
DAIKAGLANL KAVPGRLFPI QLVENQLLLD DSYNANVGSM TAAVQVLAEM PGYRVLVVGD 
MAELGAESEA CHIQVGEAAK AAGIDRVLSV GKQSHAISTA SGVGEHFSDK TALIARLKSL 
IAEQQVITIL VKGSRSAAME EVVRALQENG TC