Gene ECD_04224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_04224
Symbol	hpaX
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	4502031
End bp	4503407
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	54%
IMG OID
Product	hypothetical 4-hydroxyphenylacetate permease
Protein accession	ACT46005
Protein GI	253980335
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.65439
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGACA CCTCACCTGC CATACCGGAG AGTATCGATC CGGCGAATCA GCATAAAGCG 
CTGACTGCCG GACAACAGGC GGTTATTAAG AAGCTATTTC GCCGCCTGAT CGTCTTTCTG 
TTCGTGCTGT TTATCTTCTC GTTCCTTGAT CGCATCAACA TCGGCTTTGC CGGACTCACG 
ATGGGACGCG ACCTCGGTCT GAGCGCCACC ATGTTTGGCC TCGCTACCAC CCTGTTCTAC 
GCCGCTTATG TCATCTTCGG CATTCCCAGC AACATTATGC TGAGTATTGT CGGTGCACGG 
CGCTGGATCG CCACCATCAT GGTGCTCTGG GGCATCGCCT CTACTGCTAC CATGTTTGCC 
ACTGGCCCCA CCAGCTTATA CGTACTGCGT ATACTGGTTG GCATTACCGA AGCCGGCTTT 
CTGCCTGGCA TTCTGCTCTA TTTAACCTTC TGGTTTCCGG CCTACTTCCG CGCCCGTGCC 
AACGCCTTGT TTATGGTGGC AATGCCGGTA ACGACAGCGT TGGGATCGAT CGTTTCCGGC 
TACATTTTGT CGCTGGATGG CGTAATGGCA TTAAAAGGCT GGCAGTGGCT GTTTTTGCTG 
GAAGGCTTCC CGTCGGTATT ACTCGGCGTC ATGGTGTGGT TCTGGCTTGA TGACTCACCG 
GACAAAGCTA AGTGGCTGAC GAAAGAAGAC AAAAAATGCC TGCAAGAGAT GATGGATAAC 
GATCGTCTGA CGCTGGTTCA GCCAGAGGGA GCCATCAGCC ACCATGCCAT GCAACAACGC 
AGCATGTGGC GGGAGATCTT CACTCCGGTG GTGATGATGT ATACCCTGGC GTATTTCTGC 
CTGACCAACA CACTTAGTGC GATCAGCATC TGGACACCGC AGATCCTGCA AAGCTTTAAT 
CAGGGCAGCA GTAATATCAC CATCGGCCTG CTGGCCGCCG TACCGCAGAT TTGTACCATT 
CTCGGGATGA TCTACTGGAG CCGTCACTCA GATCGCCGCC AGGAACGAAG GCATCACACC 
GCCCTTCCTT ATTTGTTCGC TGCCGCTGGT TGGTTACTGG CTTCGGCAAC TGATCACAAC 
ATGATCCAGA TGCTGGGGAT CATTATGGCT TCGACCGGAT CATTCAGCGC AATGGCGATT 
TTCTGGACAA CACCGGATCA GTCCATCAGC CTGCGGGCAC GAGCGATCGG TATTGCGGTG 
ATCAACGCCA CTGGCAACAT TGGTTCAGCA TTAAGTCCGT TTATGATCGG CTGGTTGAAA 
GATCTGACCG GCAGCTTTAA CAGTGGATTG TGGTTTGTTG CCGCGCTGCT GGTGATTGGT 
GCAGGGATTA TCTGGGCAAT TCCAATGCAG TCCTCCCGTC CGCGAGCGAC CCCGTAA

Protein sequence

MSDTSPAIPE SIDPANQHKA LTAGQQAVIK KLFRRLIVFL FVLFIFSFLD RINIGFAGLT 
MGRDLGLSAT MFGLATTLFY AAYVIFGIPS NIMLSIVGAR RWIATIMVLW GIASTATMFA 
TGPTSLYVLR ILVGITEAGF LPGILLYLTF WFPAYFRARA NALFMVAMPV TTALGSIVSG 
YILSLDGVMA LKGWQWLFLL EGFPSVLLGV MVWFWLDDSP DKAKWLTKED KKCLQEMMDN 
DRLTLVQPEG AISHHAMQQR SMWREIFTPV VMMYTLAYFC LTNTLSAISI WTPQILQSFN 
QGSSNITIGL LAAVPQICTI LGMIYWSRHS DRRQERRHHT ALPYLFAAAG WLLASATDHN 
MIQMLGIIMA STGSFSAMAI FWTTPDQSIS LRARAIGIAV INATGNIGSA LSPFMIGWLK 
DLTGSFNSGL WFVAALLVIG AGIIWAIPMQ SSRPRATP