Gene EcHS_A4584 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4584
Symbol	hpaG
ID	5591185
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	4592825
End bp	4594114
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	56%
IMG OID	640923678
Product	4-hydroxyphenylacetate degradation bifunctional isomerase/decarboxylase
Protein accession	YP_001461118
Protein GI	157163800
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID	[TIGR02303] 4-hydroxyphenylacetate degradation bifunctional isomerase/decarboxylase, C-terminal subunit [TIGR02305] 4-hydroxyphenylacetate degradation bifunctional isomerase/decarboxylase, N-terminal subunit

Plasmid Coverage information

Num covering plasmid clones	69
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGGCA CTATCTTCGC CGTAGCGTTG AACCATCGCA GCCAACTTGA TGCATGGCAG 
GAAGCGTTCC AGCAATCCCC CTACAAAGCC CCGCCTAAAA CTGCGGTCTG GTTTATTAAA 
CCGCGCAATA CGGTGATTGG TTGCGGTGAA CCGATTCCCT TTCCACAGGG TGAAAAGGTA 
CTGAGCGGTG CGACTGTTGC GCTGATTGTG GGAAAAACGG CGACGAAAAT ACGTGAAGAA 
GATGCAGCAG AGTACATCGC CGGATATGCG CTGGCTAACG ATGTCAGCCT GCCGGAAGAG 
AGCTTTTACC GCCCGGCAAT CAAAGCAAAA TGTCGTGATG GATTCTGCCC CATTGGCGAA 
ACCGTGGCTC TCAGCAATGT CGATAATCTG ACCATCTATA CCGAGATCAA CGGGCGTCCT 
GCCGATCACT GGAATACCGC CGATTTACAA CGTAACGCCG CGCAGTTGCT GAGCGCCCTG 
AGCGAATTTG CCACACTGAA TCCAGGCGAT GCCATTCTGC TCGGCACGCC ACAGGCGCGC 
GTGGAAATAC AGCCAGGCGA TCGCGTTCGT GTTCTCGCAG AAGGTTTCCC GCCGCTGGAA 
AATCCGGTAG TGGACGAACG TGAAGTGACC ACGCGCAAGA GCTTCCCAAC GCAGCCACAC 
CCGCACGGCA CGCTGTTTGC CCTCGGCCTG AACTACGCCG ACCACGCCAG CGAACTGGAA 
TTTAAGCCAC CGGAAGAACC GCTGGTGTTC CTGAAAGCGC CAAATACCCT CACTGGCGAT 
AACCAGACCT CCGTGCGTCC AAACAATATT GAATACATGC ACTATGAAGC GGAGCTGGTG 
GTAGTTATTG GCAAACAGGC GCGTAACGTC AGCGAAGCCG ATGCCATGGA TTATGTCGCG 
GGCTACACCG TGTGTAACGA CTACGCCATT CGCGACTATC TGGAAAACTA CTACCGCCCT 
AACCTGCGGG TCAAAAGCCG CGACGGACTG ACGCCGATGC TTTCAACCAT CGTGCCGAAA 
GAGGCGATCC CGGACCCGCA TAATCTGACC CTTCGCACCT TCGTCAACGG CGAGTTACGC 
CAGCAAGGCA CCACCGCCGA TCTGATCTTC AGCGTGCCCT TCCTGATCGC CTACTTAAGC 
GAATTTATGA CCCTGAATCC GGGCGACATG ATCGCCACCG GCACACCAAA AGGCTTATCT 
GACGTGGTGC CTGGCGATGA AGTGGTGGTG GAAGTAGAAG GCGTGGGCCG CCTGGTGAAC 
CGAATTGTGA GTGAGGAAAC AGCGAAATGA

Protein sequence

MKGTIFAVAL NHRSQLDAWQ EAFQQSPYKA PPKTAVWFIK PRNTVIGCGE PIPFPQGEKV 
LSGATVALIV GKTATKIREE DAAEYIAGYA LANDVSLPEE SFYRPAIKAK CRDGFCPIGE 
TVALSNVDNL TIYTEINGRP ADHWNTADLQ RNAAQLLSAL SEFATLNPGD AILLGTPQAR 
VEIQPGDRVR VLAEGFPPLE NPVVDEREVT TRKSFPTQPH PHGTLFALGL NYADHASELE 
FKPPEEPLVF LKAPNTLTGD NQTSVRPNNI EYMHYEAELV VVIGKQARNV SEADAMDYVA 
GYTVCNDYAI RDYLENYYRP NLRVKSRDGL TPMLSTIVPK EAIPDPHNLT LRTFVNGELR 
QQGTTADLIF SVPFLIAYLS EFMTLNPGDM IATGTPKGLS DVVPGDEVVV EVEGVGRLVN 
RIVSEETAK