Gene ECD_04230 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_04230
Symbol	hpaG
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	4507907
End bp	4509196
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	56%
IMG OID
Product	4-hydroxyphenylacetate degradation bifunctional isomerase/decarboxylase
Protein accession	ACT46011
Protein GI	253980341
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGGCA CTATCTTCGC CGTAGCGTTG AACCATCGCA GCCAGCTTGA TGCATGGCAG 
GACGCGTTCC AGCAATCCCC CTACAAAGCC CCGCCTAAAA CTGCGGTCTG GTTTATTAAA 
CCGCGCAATA CGGTGATTGG TTGCGGTGAA CCGATTCCCT TTCCACAGGG TGAAAAGGTA 
CTGAGCGGTG CGACAGTTGC GTTGATTGTG GGAAAAACGG CGACGAAAGT ACGTGAAGAA 
GATGCGGCAG AGTACATCGC CGGATATGCG CTGGCTAACG ACGTCAGCCT GCCAGAAGAG 
AGCTTTTACC GCCCGGCAAT CAAAGCAAAA TGCCGTGATG GATTCTGCCC CATTGGCGAA 
ACCGTGGCTC TCAGCAATGT CGATAATCTG ACTATCTATA CCGAGATCAA CGGGCGTCCT 
GCCGATCACT GGAACACCGC CGATTTACAA CGTAACGCCG CACAGTTGCT GAGTGCCCTG 
AGCGAATTTG CCATGCTGAA TCCAGGCGAT GCCATTCTGC TCGGCACGCC ACAGGCGCGC 
GTGGAAATAC AGCCAGGCGA TCGCGTGCGT GTTCTCGCAG AAGGTTTCCC GCCGCTGGAA 
AATCCGGTAG TGGACGAACG TGAAGTGACC ACGCGCAAGA GCTTCCCAAC GCAGCCACAC 
CCGCACGGCA CGCTGTTTGC CCTCGGCCTG AACTACGCCG ACCACGCCAG CGAACTGGAA 
TTTAAGCCAC CGGAAGAGCC GCTGGTGTTC CTGAAAGCGC CGAATACCCT CACTGGCGAT 
AACCAGACCT CCGTTCGCCC AAACAATATT GCATACATGC ACTACGAAGC GGAGCTGGTG 
GTGGTGATTG GCAAGCAGGC GCGTAACGTC AGCGAAGCCG ATGCCATGGA TTATGTCGCG 
GGCTACACCG TGTGTAACGA CTACGCCATT CGCGACTATC TGGAAAACTA CTACCGCCCT 
AACCTGCGGG TAAAAAGCCG CGACGGACTG ACGCCGATGC TTTCAACCAT CGTGCCGAAA 
GAGGCGATCC CGGACCCGCA TAATCTGACC CTTCGCACCT TCGTCAACGG CGAGTTACGC 
CAGCAAGGCA CCACCGCCGA TCTGATCTTC AGCGTGCCCT TCCTGATCGC CTACTTAAGC 
GAATTTATGA CCCTGAATCC GGGCGACATG ATCGCCACCG GCACACCAAA AGGCTTATCT 
GACGTAGTGC CTGGCGATGA AGTAGTGGTG GAAGTAGAAG GCGTGGGCCG CCTGGTGAAC 
CGAATTGTGA GTGAGGAAAC AGCGAAATGA

Protein sequence

MKGTIFAVAL NHRSQLDAWQ DAFQQSPYKA PPKTAVWFIK PRNTVIGCGE PIPFPQGEKV 
LSGATVALIV GKTATKVREE DAAEYIAGYA LANDVSLPEE SFYRPAIKAK CRDGFCPIGE 
TVALSNVDNL TIYTEINGRP ADHWNTADLQ RNAAQLLSAL SEFAMLNPGD AILLGTPQAR 
VEIQPGDRVR VLAEGFPPLE NPVVDEREVT TRKSFPTQPH PHGTLFALGL NYADHASELE 
FKPPEEPLVF LKAPNTLTGD NQTSVRPNNI AYMHYEAELV VVIGKQARNV SEADAMDYVA 
GYTVCNDYAI RDYLENYYRP NLRVKSRDGL TPMLSTIVPK EAIPDPHNLT LRTFVNGELR 
QQGTTADLIF SVPFLIAYLS EFMTLNPGDM IATGTPKGLS DVVPGDEVVV EVEGVGRLVN 
RIVSEETAK