Gene EcE24377A_0376 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_0376
Symbol	mhpE
ID	5587752
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	408462
End bp	409475
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	56%
IMG OID	640924101
Product	4-hydroxy-2-ketovalerate aldolase
Protein accession	YP_001461528
Protein GI	157155206
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR03217] 4-hydroxy-2-oxovalerate aldolase

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGGTA AAAAACTTTA TATCTCGGAC GTCACGTTGC GTGACGGTAT GCACGCCATT 
CGTCATCAGT ATTCGCTGGA AAACGTTCGC CAGATTGCCA AAGCACTGGA CGATGCCCGC 
GTGGATTCGA TTGAAGTGGC CCATGGCGAC GGTTTGCAGG GTTCCAGCTT TAACTATGGT 
TTCGGCGCAC ATAGCGACCT TGAATGGATT GAAGCAGCGG CGGATGTGGT GAAGCACGCC 
AAAATCGCGA CGTTGTTGCT GCCAGGAATC GGCACTATTC ACGATCTGAA AAATGCCTGG 
CAGGCTGGCG CGCGGGTGGT TCGTGTGGCA ACGCACTGTA CCGAAGCTGA TGTTTCCGCC 
CAGCATATTC AGTATGCCCG CGAGCTCGGA ATGGACACCG TTGGTTTTCT GATGATGAGC 
CATATGACCA CGCCGGAGAA TCTCGCAAAG CAGGCAAAGC TGATGGAAGG CTACGGTGCG 
ACCTGTATTT ATGTGGTGGA TTCTGGCGGT GCGATGAACA TGAGCGATAT CCGTGACCGT 
TTCCGCGCCC TGAAAGCAGA GCTGAAACCA GAAACGCAAA CTGGCATGCA CGCTCACCAT 
AACCTGAGTC TTGGCGTGGC GAACTCTATC GCGGCGGTGG AAGAGGGCTG CGACCGAATC 
GACGCCAGCC TCGCGGGAAT GGGCGCGGGC GCAGGTAACG CGCCGCTGGA AGTATTTATT 
GCCGCCGCGG ATAAACTGGG CTGGCAGCAT GGGACCGATC TCTATGCGTT AATGGATGCC 
GCTGACGACC TGGTGCGTCC GTTGCAGGAT CGACCGGTAC GAGTCGATCG CGAAACGCTG 
GCGCTGGGAT ACGCTGGTGT TTACTCGAGC TTCCTGCGTC ACTGTGAAAC GGCGGCGGCG 
CGTTATGGCT TAAGTGCGGT GGATATTCTC GTTGAGCTGG GCAAACGCCG GATGGTTGGC 
GGCCAGGAGG ATATGATCGT TGACGTGGCG CTGGATCTGC GCAACAACAA ATAA

Protein sequence

MNGKKLYISD VTLRDGMHAI RHQYSLENVR QIAKALDDAR VDSIEVAHGD GLQGSSFNYG 
FGAHSDLEWI EAAADVVKHA KIATLLLPGI GTIHDLKNAW QAGARVVRVA THCTEADVSA 
QHIQYARELG MDTVGFLMMS HMTTPENLAK QAKLMEGYGA TCIYVVDSGG AMNMSDIRDR 
FRALKAELKP ETQTGMHAHH NLSLGVANSI AAVEEGCDRI DASLAGMGAG AGNAPLEVFI 
AAADKLGWQH GTDLYALMDA ADDLVRPLQD RPVRVDRETL ALGYAGVYSS FLRHCETAAA 
RYGLSAVDIL VELGKRRMVG GQEDMIVDVA LDLRNNK