Gene EcHS_A0416 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0416
Symbol	mhpE
ID	5595038
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	438374
End bp	439387
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	56%
IMG OID	640919601
Product	4-hydroxy-2-ketovalerate aldolase
Protein accession	YP_001457186
Protein GI	157159868
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR03217] 4-hydroxy-2-oxovalerate aldolase

Plasmid Coverage information

Num covering plasmid clones	73
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGGTA AAAAACTTTA TATCTCGGAC GTCACGTTGC GTGACGGTAT GCACGCCATT 
CGTCATCAGT ATTCGCTGGA AAACGTTCGC CATATTGCCA AAGCACTGGA CGATGCCCGC 
GTGGATTCGA TTGAAGTGGC CCATGGCGAC GGTTTGCAGG GTTCCAGCTT TAACTATGGT 
TTCGGCGCAC ATAGCGACCT TGAATGGATT GAAGCAGCGG CGGATGTGGT GAAGCACGCC 
AAAATCGCGA CGTTGTTGCT GCCAGGAATC GGCACTATTC ACGATCTGAA AAATGCCTGG 
CAGGCTGGCG CGCGGGTGGT TCGTGTGGCA ACGCACTGTA CCGAAGCTGA TGTTTCCGCC 
CAGCATATTC AGTATGCCCG CGAGCTCGGA ATGGACACCG TTGGTTTTCT GATGATGAGC 
CATATGACCA CGCCGGAGAA TCTCGCAAAG CAGGCAAAGC TGATGGAAGG CTACGGTGCG 
ACCTGTATTT ATGTGGTGGA TTCTGGCGGT GCGATGAACA TGAGCGATAT CCGTGACCGT 
TTCCGCGCCC TGAAAGCAGA GCTGAAACCA GAAACGCAAA CTGGCATGCA CGCTCACCAT 
AACCTGAGTC TTGGCGTGGC GAACTCTATC GCGGCGGTGG AAGAGGGCTG CGACCGAATC 
GACGCCAGCC TCGCGGGAAT GGGCGCGGGC GCAGGTAACG CACCGCTGGA AGTGTTTATT 
GCCGCCGCGG ATAAACTGGG CTGGCAGCAT GGGACCGATC TCTATGCGTT AATGGATGCC 
GCCGACGACC TGGTGCGTCC GTTGCAGGAT CGACCGGTAC GAGTCGATCG CGAAACGCTG 
GCGCTGGGAT ACGCTGGTGT TTACTCGAGC TTCCTGCGTC ACTGTGAAAC GGCGGCGGCG 
CGTTATGGCT TAAGTGCGGT GGATATTCTC GTTGAGCTGG GCAAACGCCG GATGGTTGGC 
GGCCAGGAGG ATATGATCGT TGACGTGGCG CTGGATCTGC GCAACAACAA ATAA

Protein sequence

MNGKKLYISD VTLRDGMHAI RHQYSLENVR HIAKALDDAR VDSIEVAHGD GLQGSSFNYG 
FGAHSDLEWI EAAADVVKHA KIATLLLPGI GTIHDLKNAW QAGARVVRVA THCTEADVSA 
QHIQYARELG MDTVGFLMMS HMTTPENLAK QAKLMEGYGA TCIYVVDSGG AMNMSDIRDR 
FRALKAELKP ETQTGMHAHH NLSLGVANSI AAVEEGCDRI DASLAGMGAG AGNAPLEVFI 
AAADKLGWQH GTDLYALMDA ADDLVRPLQD RPVRVDRETL ALGYAGVYSS FLRHCETAAA 
RYGLSAVDIL VELGKRRMVG GQEDMIVDVA LDLRNNK