Gene YpsIP31758_3218 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_3218
Symbol	pheA
ID	5386466
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	+
Start bp	3624754
End bp	3625911
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	48%
IMG OID	640866227
Product	bifunctional chorismate mutase/prephenate dehydratase
Protein accession	YP_001402175
Protein GI	153947439
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0077] Prephenate dehydratase [COG1605] Chorismate mutase
TIGRFAM ID	[TIGR01797] chorismate mutase domain of proteobacterial P-protein, clade 1

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	0.631051
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGATA ATCCATTACT GGTGCTGCGT GAACGTATCA GTGCATTAGA TTTAAAACTG 
CTGGCTTTGC TGGCAGAACG GCGTGAACTG GCAGTGGATG TGGCCAAAGC CAAGCAGCTC 
CATCATCGCC CAATTCGCGA TAAAGAACGT GAGCGTGACT TATTAGACGC ACTGATCGAT 
GCCGCTAAGC CTTATAATCT TGATGGATTC TATGTCACAC GCCTGTTTCA GCTGATTATT 
GAAGATTCCG TATTGACCCA GCAGGCTTTA TTGCAACATC AGCTTAACCA AACCGCCCTG 
CTCTCTGCCC GTATCGCCTT CCTTGGCCCT AAGGGCTCCT ATTCACATCT GGCAGCTCGC 
CAATATGCAG CACGTCATTT TGAGCAATTA ATTGAATGCG GTTGCCTGAA ATTCCAAGAC 
ATTTTTACCC AGGTTGAAAC CGGGCAAGCG GATTACGCCG TACTGCCTAT CGAGAATACC 
AGTTCAGGTT CTATTAATGA TGTGTATGAC TTACTCCAAC ACACCAGCTT GTCTATTGTG 
GGCGAAATAA CCAACCCTAT CGAGCACTGC GTACTCATTG CCACAGAAAC AGATTTGAAC 
AAAATTGAGA CTGTATACAG CCATCCTCAG CCTTTCCAGC AATGCAGCCA GTTCATTAAT 
CGTTTCCCAC ATTGGAAAAT TGAATATTGT GAGAGTACGG CTGCCGCGAT GGAAAAAGTT 
GCAGGAATGA AATCACCAAC GGCGGCTGCA TTAGGTAGCG AAGCGGGCGG TGCGCTCTAT 
AATCTGCAAG TGCTGGAGCA CAATCTGGCA AATCAGCAAC AAAATATTAC TCGATTCATT 
GTCCTTGCCC GCAAACCCAT TGATGTATCT GAGCAAATCC CGGCCAAAAC CACCTTAATT 
ATGGCGACCG GGCAGCAATC CGGGGCATTG GTAGAGGCTT TGCTGGTACT CAGAGAGCAT 
GGCATTATCA TGACGAAACT GGAGTCCCGG CCAATTAATG GCAACCCGTG GGAAGAGATG 
TTTTATATTG ATGTGCAGGC CAATATACGT TCAGAAGCGA TGCAAAAAGC ATTGGCCGAT 
CTAACACCGA TTACCCGTTC CTTAAAAGTG TTGGGCTGCT ACCCAAGTGA GAACGTCGTT 
CCCGTCGAGC CTCGGTAA

Protein sequence

MTDNPLLVLR ERISALDLKL LALLAERREL AVDVAKAKQL HHRPIRDKER ERDLLDALID 
AAKPYNLDGF YVTRLFQLII EDSVLTQQAL LQHQLNQTAL LSARIAFLGP KGSYSHLAAR 
QYAARHFEQL IECGCLKFQD IFTQVETGQA DYAVLPIENT SSGSINDVYD LLQHTSLSIV 
GEITNPIEHC VLIATETDLN KIETVYSHPQ PFQQCSQFIN RFPHWKIEYC ESTAAAMEKV 
AGMKSPTAAA LGSEAGGALY NLQVLEHNLA NQQQNITRFI VLARKPIDVS EQIPAKTTLI 
MATGQQSGAL VEALLVLREH GIIMTKLESR PINGNPWEEM FYIDVQANIR SEAMQKALAD 
LTPITRSLKV LGCYPSENVV PVEPR