Gene EcolC_3571 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3571
Symbol	murF
ID	6065724
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	3903573
End bp	3904931
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	55%
IMG OID	641602988
Product	UDP-N-acetylmuramoyl-tripeptide--D-alanyl-D- alanine ligase
Protein accession	YP_001726512
Protein GI	170021558
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0770] UDP-N-acetylmuramyl pentapeptide synthase
TIGRFAM ID	[TIGR01143] UDP-N-acetylmuramoyl-tripeptide--D-alanyl-D-alanine ligase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00253313
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATTAGCG TAACCCTTAG CCAACTTACC GACATTCTCA ACGGTGAACT GCAAGGTGCA 
GATATCACCC TTGATGCTGT AACCACTGAT ACCCGAAAAC TGACGCCGGG CTGCCTGTTT 
GTTGCCCTGA AAGGCGAACG TTTCGATGCT CATGATTTTG CCGACCAGGC GAAAGCTGGC 
GGCGCAGGCG CACTACTGGT TAGCCGTCCG CTGGACATCG ACCTGCCGCA GTTAATCGTC 
AAGGATACGC GTCTGGCGTT TGGTGAACTG GCTGCATGGG TTCGCCAGCA AGTTCCGGCG 
CGCGTGGTTG CTCTGACAGG TTCCTCCGGC AAAACCTCCG TTAAAGAGAT GACGGCGGCT 
ATTTTAAGCC AGTGCGGCAA CACGCTTTAT ACGGCAGGCA ATCTCAACAA CGACATCGGT 
GTACCGATGA CGCTGTTGCG CTTAACGCCG GAATACGATT ACGCAGTTAT TGAACTTGGC 
GCGAACCATC AGGGCGAAAT AGCCTGGACT GTGAGTCTGA CTCGCCCGGA AGCTGCGCTG 
GTCAACAACC TGGCAGCGGC GCATCTGGAA GGTTTTGGCT CGCTTGCGGG TGTCGCGAAA 
GCGAAAGGTG AAATCTTTAG CGGCCTGCCG GAAAACGGTA TCGCCATTAT GAACGCCGAC 
AACAACGACT GGCTGAACTG GCAGAGCGTA ATTGGCTCAC GCAAAGTGTG GCGTTTCTCA 
CCCAATGCCG CCAACAGCGA TTTCACCGCC ACCAATATCC ATGTGACCTC GCACGGTACG 
GAATTTACCC TACAAACCCC AACCGGTAGC GTCGATGTTC TGCTGCCGTT GCCGGGGCGT 
CACAATATTG CGAATGCGCT GGCAGCCGCT GCGCTCTCCA TGTCCGTGGG CGCAACGCTT 
GATGCTATCA AAGCGGGGCT GGCAAATCTG AAAGCTGTTC CAGGCCGTCT GTTCCCCATC 
CAACTGGCAG AAAACCAGTT GCTGCTCGAC GACTCCTACA ACGCCAATGT CGGTTCAATG 
ACTGCAGCAG TCCAGGTACT GGCTGAAATG CCGGGCTACC GCGTGCTGGT GGTGGGCGAT 
ATGGCGGAAC TGGGCGCTGA AAGCGAAGCC TGCCATGTAC AGGTGGGCGA GGCGGCAAAA 
GCTGCTGGTA TTGACCGCGT GTTAAGCGTG GGTAAACAAA GCCATGCTAT CAGCACCGCC 
AGCGGCGTTG GCGAACATTT TGCTGATAAA ACTGCGTTAA TTACGCGTCT TAAATCACTG 
ATTGCTGAGC AACAGGTAAT TACGATTTTA GTTAAGGGTT CACGTAGTGC CGCCATGGAA 
GAGGTAGTAC GCGCTTTACA GGAGAATGGG ACATGTTAG

Protein sequence

MISVTLSQLT DILNGELQGA DITLDAVTTD TRKLTPGCLF VALKGERFDA HDFADQAKAG 
GAGALLVSRP LDIDLPQLIV KDTRLAFGEL AAWVRQQVPA RVVALTGSSG KTSVKEMTAA 
ILSQCGNTLY TAGNLNNDIG VPMTLLRLTP EYDYAVIELG ANHQGEIAWT VSLTRPEAAL 
VNNLAAAHLE GFGSLAGVAK AKGEIFSGLP ENGIAIMNAD NNDWLNWQSV IGSRKVWRFS 
PNAANSDFTA TNIHVTSHGT EFTLQTPTGS VDVLLPLPGR HNIANALAAA ALSMSVGATL 
DAIKAGLANL KAVPGRLFPI QLAENQLLLD DSYNANVGSM TAAVQVLAEM PGYRVLVVGD 
MAELGAESEA CHVQVGEAAK AAGIDRVLSV GKQSHAISTA SGVGEHFADK TALITRLKSL 
IAEQQVITIL VKGSRSAAME EVVRALQENG TC