Gene ECH74115_1971 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1971
Symbol
ID	6969100
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	1863759
End bp	1864724
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	54%
IMG OID	643385896
Product	mandelate racemase/muconate lactonizing enzyme family protein
Protein accession	YP_002270385
Protein GI	209399075
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	0.402393
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAACCG TTAAGGTATT TGAGGAAGCC TGGCCCTTAC ATACCCCGTT TGTGATTGCC 
CGGGGAAGTC GCAGTGAAGC GCGCGTGGTG GTGGTTGAAC TGGAAGAAGA GGGTATTAAA 
GGCACCGGCG AATGCACGCC GTATCCGCGT TATGGAGAAA GTGATGCCTC GGTAATGGCG 
CAAATTATGA GCGTCGTGCC GCAATTAGAG AAAGGGCTGA CACGGGAGGA GTTGCAAAAA 
ATTCTCCCTG CCGGCGCAGC ACGTAATGCG CTGGATTGTG CATTGTGGGA TCTGGCCGCG 
CGAAAACAGC AGCAATCGCT GGCTGATTTG ATCGGCATAA CGCTTCCCGA GACAGTTATC 
ACTGCACAGA CGGTAGTCAT CGGTACGCCT GATCAGATGG CCAATAGTGC ATCAACACTC 
TGGCAGGCCG GCGCGAAATT ACTGAAAGTG AAGCTGGATA ACCATCTTAT CAGTGAGCGG 
ATGGTGGCAA TTCGCACAGC TGTGCCCGAT ACCACGCTGA TCGTTGATGC AAATGAATCC 
TGGCATGCAG AAGGGTTGGC GGCACGTTGC CAGCTATTGG CGGATTTAGG CGTTGCGATG 
CTTGAACAAC CGCTTCCTGC GCAGGACGAT GCGGCGCTGG AGAATTTTAT TCATCCGTTG 
CCGATTTGTG CTGATGAAAG TTGTCATACT CGTAGCAATT TGAAGGCGCT GAAAGGGCGC 
TATGAGATGG TTAATATTAA GCTCGATAAA ACCGGGGGTC TGACGGAAGC GCTGGCGCTG 
GCGACTGAAG CGCGTGCACA AGGTTTCAGT CTGATGCTGG GCTGCATGTT GTGTACCTCT 
CGGGCCATTA GCGCCGCTTT ACCGCTGGTG CCGCAGGTCA GTTTCGCCGA TCTTGACGGA 
CCGACCTGGC TGGCGGTAGA TGTGGAACCG GCGCTTCAGT TCACGACGGG CGAATTGCAT 
CTTTAG

Protein sequence

MRTVKVFEEA WPLHTPFVIA RGSRSEARVV VVELEEEGIK GTGECTPYPR YGESDASVMA 
QIMSVVPQLE KGLTREELQK ILPAGAARNA LDCALWDLAA RKQQQSLADL IGITLPETVI 
TAQTVVIGTP DQMANSASTL WQAGAKLLKV KLDNHLISER MVAIRTAVPD TTLIVDANES 
WHAEGLAARC QLLADLGVAM LEQPLPAQDD AALENFIHPL PICADESCHT RSNLKALKGR 
YEMVNIKLDK TGGLTEALAL ATEARAQGFS LMLGCMLCTS RAISAALPLV PQVSFADLDG 
PTWLAVDVEP ALQFTTGELH L