Gene EcolC_2300 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2300
Symbol
ID	6066945
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2536735
End bp	2537700
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	54%
IMG OID	641601703
Product	mandelate racemase/muconate lactonizing protein
Protein accession	YP_001725262
Protein GI	170020308
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.467318
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAACCG TTAAGGTATT TGAGGAAGCC TGGCCCTTAC ATACCCCGTT TGTGATTGCC 
CGGGGAAGTC GCAGTGAAGC GCGCGTGGTG GTGGTTGAAC TGGAAGAAGA GGGTATTAAA 
GGCACCGGCG AATGCACGCC GTATCCGCGT TATGGAGAAA GTGATGCCTC GGTAATGGCG 
CAAATTATGA GCGTCGTGTC GCAATTAGAG AAAGGGCTGA CACGGGAGGA GTTGCAAAAA 
ATTCTCCCTG CCGGCGCAGC ACGTAATGCG CTGGATTGTG CATTGTGGGA TCTGGCCGCG 
CGAAAACAGC AGCAATCGCT GGCTGATTTG ATCGGCATAA CGCTTCCCGA GACAGTTATC 
ACTGCACAGA CGGTAGTCAT CGGTACGCCT GATCAGATGG CCAATAGTGC ATCAACACTC 
TGGCAGGCAG GCGCGAAATT ACTGAAAGTG AAGCTGGATA ACCATCTTAT TAGTGAGCGG 
ATGGTGGCAA TTCGCACAGC TGTGCCCGAT GCGACGCTGA TCGTTGATGC AAATGAATCC 
TGGCGTGCAG AAGGGTTGGC GGCGCGTTGC CAGCTATTGG CGGATTTAGG CGTTGCGATG 
CTTGAACAAC CCCTTCCTGC GCAGGACGAT GCGGCGCTGG AGAATTTTAT TCATCCGTTG 
CCGATTTGTG CTGATGAGAG TTGTCATACT CGTAGCAATT TGAAGGCGCT GAAAGGGCGC 
TATGAGATGG TTAACATTAA GCTCGATAAA ACCGGTGGTC TGACGGAAGC GCTGGCGCTG 
GCGACTGAAG CGCGTGCACA AGGTTTCAGT CTGATGCTGG GCTGCATGTT GTGTACCTCT 
CGTGCCATTA GCGCCGCTTT ACCGCTGGTG CCGCAGGTCA GTTTCGCCGA TCTTGACGGA 
CCGACCTGGC TGGCGGTAGA TGTGGAACCG GCGCTTCAGT TCACGACGGG CGAATTGCAT 
CTTTAG

Protein sequence

MRTVKVFEEA WPLHTPFVIA RGSRSEARVV VVELEEEGIK GTGECTPYPR YGESDASVMA 
QIMSVVSQLE KGLTREELQK ILPAGAARNA LDCALWDLAA RKQQQSLADL IGITLPETVI 
TAQTVVIGTP DQMANSASTL WQAGAKLLKV KLDNHLISER MVAIRTAVPD ATLIVDANES 
WRAEGLAARC QLLADLGVAM LEQPLPAQDD AALENFIHPL PICADESCHT RSNLKALKGR 
YEMVNIKLDK TGGLTEALAL ATEARAQGFS LMLGCMLCTS RAISAALPLV PQVSFADLDG 
PTWLAVDVEP ALQFTTGELH L