Gene ECH74115_3838 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3838
Symbol	pheA
ID	6970980
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	3561973
End bp	3563133
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	49%
IMG OID	643387621
Product	bifunctional chorismate mutase/prephenate dehydratase
Protein accession	YP_002272070
Protein GI	209399059
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0077] Prephenate dehydratase [COG1605] Chorismate mutase
TIGRFAM ID	[TIGR01797] chorismate mutase domain of proteobacterial P-protein, clade 1

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.000000574807
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATCGG AAAACCCGTT ACTGGCGCTG CGAGAGAAAA TCAGCGCGCT GGATGAAAAA 
TTATTAGCAT TACTGGCAGA GCGGCGCGAA CTGGCCGTCG AGGTGGGAAA AGCCAAACTG 
CTCTCGCATC GCCCGGTACG TGATATTGAT CGTGAACGCG ATTTACTGGA AAGATTAATT 
ACGCTCGGTA AAGCGCACCA TCTGGACGCC CATTACATTA CTCGCCTGTT CCAGCTCATC 
ATTGAAGATT CCGTATTAAC TCAGCAGGCT TTGCTCCAAC AACATCTCAA TAAAATTAAT 
CCGCACTCAG CACGCATCGC TTTTCTCGGC CCCAAAGGTT CTTATTCCCA TCTTGCGGCG 
CGCCAGTATG CTGCCCGTCA CTTTGAGCAA TTCATTGAAA GTGGCTGCGC CAAATTTGCC 
GATATTTTTA ATCAGGTGGA AACCGGCCAG GCCGACTATG CCGTCGTACC GATTGAAAAT 
ACCAGCTCCG GTGCCATAAA TGACGTTTAC GATCTGCTGC AACATACCAG CTTGTCGATT 
GTTGGCGAGA TGACGTTAAC TATCGACCAT TGTTTGTTAG TCTCCGGCAC GACTGATTTA 
TCCACCATCA ATACGGTCTA CAGCCATCCG CAGCCATTCC AGCAATGCAG CAAATTCCTT 
AATCGTTATC CGCACTGGAA GATTGAATAT ACCGAAAGTA CGTCTGCGGC AATGGAAAAG 
GTTGCACAGG CAAAATCACC GCATGTTGCT GCGTTAGGAA GCGAAGCTGG CGGCACTTTG 
TACGGTTTGC AGGTACTGGA GCGGATTGAA GCGAATCAGC GACAAAACTT CACCCGATTT 
GTGGTGTTGG CGCGTAAAGC CATTAACGTG TCTGATCAGG TTCCGGCGAA AACGACGTTG 
TTAATGGCGA CCGGGCAACA AGCCGGTGCG CTGGTTGAAG CGTTGCTGGT ACTGCGCAAC 
CACAATCTGA TTATGACCCG TCTGGAATCA CGCCCGATTC ACGGTAATCC ATGGGAAGAG 
ATGTTTTATC TGGATATTCA GGCCAATCTT GAATCAGCGG AAATGCAAAA AGCATTGAAA 
GAGTTAGGGG AAATCACCCG TTCAATGAAG GTATTGGGCT GTTACCCTAG TGAGAACGTA 
GTGCCTGTTG ATCCAACCTG A

Protein sequence

MTSENPLLAL REKISALDEK LLALLAERRE LAVEVGKAKL LSHRPVRDID RERDLLERLI 
TLGKAHHLDA HYITRLFQLI IEDSVLTQQA LLQQHLNKIN PHSARIAFLG PKGSYSHLAA 
RQYAARHFEQ FIESGCAKFA DIFNQVETGQ ADYAVVPIEN TSSGAINDVY DLLQHTSLSI 
VGEMTLTIDH CLLVSGTTDL STINTVYSHP QPFQQCSKFL NRYPHWKIEY TESTSAAMEK 
VAQAKSPHVA ALGSEAGGTL YGLQVLERIE ANQRQNFTRF VVLARKAINV SDQVPAKTTL 
LMATGQQAGA LVEALLVLRN HNLIMTRLES RPIHGNPWEE MFYLDIQANL ESAEMQKALK 
ELGEITRSMK VLGCYPSENV VPVDPT