Gene EcolC_2049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2049
Symbol
ID	6067763
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2261351
End bp	2262565
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	51%
IMG OID	641601461
Product	mandelate racemase/muconate lactonizing protein
Protein accession	YP_001725020
Protein GI	170020066
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.362051
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATCG TAAAGGCTGA AGTTTTTGTT ACCTGTCCGG GGCGTAATTT CGTCACATTA 
AAAATCACCA CTGAGGACGG TATTACGGGC CTTGGGGATG CCACCCTCAA TGGACGTGAG 
CTTTCCGTGG CCTCTTATTT GCAGGATCAC CTTTGTCCGC AGCTTATTGG TCGCGATGCG 
CACCGTATCG AAGATATCTG GCAGTTTTTC TATAAAGGTG CTTACTGGCG TCGCGGTCCG 
GTTACGATGT CGGCCATTTC AGCGGTTGAT ATGGCGCTGT GGGATATTAA AGCCAAAGCT 
GCCAACATGC CGCTTTACCA GTTACTCGGC GGCGCGTCTC GTGAAGGGGT GATGGTTTAT 
TGCCATACCA CCGGTCACAG TATTGATGAA GCTCTGGATG ATTATGCCCG TCATCAAGAG 
CTTGGATTCA AAGCCATCCG CGTGCAGTGC GGAATCCCTG GTATGAAAAC CACCTACGGC 
ATGTCGAAAG GTAAAGGTCT GGCTTATGAA CCCGCAACCA AAGGACAGTG GCCGGAAGAG 
CAGCTGTGGT CGACGGAGAA ATACCTCGAT TTCATGCCGA AATTGTTTGA CGCGGTACGT 
AACAAGTTTG GTTTTAATGA ACATTTGCTG CATGACATGC ACCATCGCTT AACGCCTATT 
GAAGCGGCGC GCTTTGGTAA AAGCATTGAA GATTATCGCA TGTTCTGGAT GGAAGACCCG 
ACGCCTGCGG AAAACCAGGA ATGCTTCCGT CTCATTCGCC AACATACCGT CACACCCATC 
GCAGTGGGTG AAGTCTTCAA CAGCATCTGG GACTGCAAAC AACTGATTGA AGAGCAACTC 
ATCGATTATA TCCGCACCAC GCTGACCCAT GCAGGCGGAA TTACCGGTAT GCGCCGGATT 
GCCGATTTTG CTTCGCTGTA TCAGGTACGT ACTGGCTCAC ACGGTCCTTC CGATTTGTCA 
CCAGTCTGCA TGGCTGCGGC GCTGCACTTT GATCTGTGGG TCCCCAATTT CGGTGTCCAG 
GAATACATGG GTTATTCCGA ACAAATGCTC GAAGTCTTCC CGCACAACTG GACTTTCGAT 
AACGGCTATA TGCATCCGGG AGACAAACCG GGTCTTGGTA TCGAATTCGA TGAAAAGCTG 
GCGGCGAAAT ATCCCTATGA ACCTGCTTAT CTACCAGTCG CACGTCTGGA AGATGGCACG 
CTGTGGAACT GGTAA

Protein sequence

MKIVKAEVFV TCPGRNFVTL KITTEDGITG LGDATLNGRE LSVASYLQDH LCPQLIGRDA 
HRIEDIWQFF YKGAYWRRGP VTMSAISAVD MALWDIKAKA ANMPLYQLLG GASREGVMVY 
CHTTGHSIDE ALDDYARHQE LGFKAIRVQC GIPGMKTTYG MSKGKGLAYE PATKGQWPEE 
QLWSTEKYLD FMPKLFDAVR NKFGFNEHLL HDMHHRLTPI EAARFGKSIE DYRMFWMEDP 
TPAENQECFR LIRQHTVTPI AVGEVFNSIW DCKQLIEEQL IDYIRTTLTH AGGITGMRRI 
ADFASLYQVR TGSHGPSDLS PVCMAAALHF DLWVPNFGVQ EYMGYSEQML EVFPHNWTFD 
NGYMHPGDKP GLGIEFDEKL AAKYPYEPAY LPVARLEDGT LWNW