Gene EcHS_A1440 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1440
Symbol
ID	5591912
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	1436381
End bp	1437346
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	55%
IMG OID	640920595
Product	mandelate racemase/muconate lactonizing enzyme family protein
Protein accession	YP_001458154
Protein GI	157160836
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	64
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAACCG TTAAGGTATT CGAGGAAGCC TGGCCCTTAC ATACCCCGTT TGTGATTGCC 
CGGGGAAGTC GCAGTGAAGC GCGCGTGGTG GTGGTTGAAC TGGAAGAAGA GGGTATTAAA 
GGCACCGGCG AATGCACGCC GTATCCGCGT TATGGGGAAA GTGATGCCTC GGTAATGGCG 
CAAATTATGA GCGTCGTGCC GCAACTAGAG AAAGGGCTGA CACGGGAGGA GTTGCAAAAA 
ATTCTCCCTG CCGGCGCAGC ACGTAATGCG CTGGATTGTG CATTGTGGGA TCTGGCCGCG 
CGAAGACAGC AGCAATCGCT GGCTGATTTG ATCGGCATAA CGCTTCCCGA GACAGTTATC 
ACTGCACAGA CGGTTGTCAT CGGTACGCCT GATCAGATGG CCAATAGTGC ATCAACACTC 
TGGCAGGCAG GCGCGAAATT ACTGAAAGTG AAGCTGGATA ACCATCTTAT CAGTGAGCGG 
ATGGTGGCAA TTCGCACAGC TGTGCCCGAT GCGACGCTGA TCGTTGATGC AAATGAATCC 
TGGCGTGCAG AAGGGTTGGC GGCGCGTTGC CAGCTATTGG CGGATTTAGG CGTTGCGATG 
CTTGAACAAC CGCTTCCTGC GCAGGACGAT GCGGCGCTGG AGAATTTTAT TCATCCGTTG 
CCGATTTGTG CTGATGAAAG TTGTCATACT CGTAGCAATT TGAAGGCGCT GAAAGGGCGC 
TATGAGATGG TTAATATTAA GCTCGATAAA ACCGGGGGTC TGACGGAAGC GCTGGCGCTG 
GCGACTGAAG CGCGTGCACA AGGTTTCAGT CTGATGCTGG GCTGCATGTT GTGTACCTCT 
CGTGCCATTA GCGCCGCTTT ACCGCTGGTG CCGCAGGTCA GTTTCGCCGA TCTTGACGGA 
CCGACCTGGC TGGCGGTAGA TGTGGAACCG GCGCTTCAGT TCACGACGGG CGAATTGCAT 
CTTTAG

Protein sequence

MRTVKVFEEA WPLHTPFVIA RGSRSEARVV VVELEEEGIK GTGECTPYPR YGESDASVMA 
QIMSVVPQLE KGLTREELQK ILPAGAARNA LDCALWDLAA RRQQQSLADL IGITLPETVI 
TAQTVVIGTP DQMANSASTL WQAGAKLLKV KLDNHLISER MVAIRTAVPD ATLIVDANES 
WRAEGLAARC QLLADLGVAM LEQPLPAQDD AALENFIHPL PICADESCHT RSNLKALKGR 
YEMVNIKLDK TGGLTEALAL ATEARAQGFS LMLGCMLCTS RAISAALPLV PQVSFADLDG 
PTWLAVDVEP ALQFTTGELH L