Gene ECH74115_5556 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5556
Symbol	tyrB
ID	6968947
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	5195427
End bp	5196662
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	53%
IMG OID	643389197
Product	aromatic amino acid aminotransferase
Protein accession	YP_002273594
Protein GI	209395724
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1448] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.187921
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTGTTTTA ACCACCTGCC CGTAAACCTA GAGAACCATC GCGTGTTTCA AAAAGTTGAC 
GCCTACGCTG GCGACCCGAT TCTTACGCTT ATGGAGCGTT TTAAAGAAGA CCCTCGCAGC 
GACAAAGTGA ATTTAAGTAT CGGTCTGTAC TACAACGAAG ACGGAATTAT TCCACAATTG 
AAAGCCGTGG CGGAGGCGGA AGCGCGCCTG AATGCGGTGC CTCATGGCGC TTCGCTTTAT 
TTACCGATGG AAGGGCTTAA CAGCTATCGC CATGCCATTG CGCCGCTGCT GTTTGGTGCC 
GACCATCCGG TACTGCAACA ACAGCGCGTA GCAACCATTC AAACCCTTGG CGGCTCAGGG 
GCATTGAAAG TGGGCGCGGA TTTCCTGAAA CGCTACTTCC CGGAATCAGG CGTCTGGGTC 
AGCGATCCTA CCTGGGAAAA CCACGTAGCA ATATTCGCCG GGGCTGGATT CGAAGTAAGC 
ACTTACCCCT GGTATGACGA AGCGACTAAC GGCGTGCGCT TTAATGACCT GTTGGCGATG 
CTGAAAACAT TACCTGCCCG CAGTATTGTG TTGCTGCATC CATGTTGCCA CAACCCAACG 
GGTGCCGATC TCACTAATGA CCAGTGGGAT GCGGTGATTG AAATTCTCAA AGCCCGCGAG 
CTTATCCCAT TCCTTGATAT TGCCTATCAA GGATTTGGTG CCGGTATGGA AGAGGATGCC 
TACGCCATTC GCGCCATTGC CAGCGCTGGA TTACCCGCTC TGGTGAGCAA TTCGTTCTCG 
AAAATTTTCT CCCTTTACGG CGAGCGCGTC GGCGGACTTT CTGTTCTGTG TGAAGATGCC 
GAAGCTGCAG GCCGCGTACT GGGGCAATTG AAAGCAACAG TTCGCCGCAA CTACTCCAGC 
CCGCCGAATT TTGGTGCGCA GGTGGTGGCT GCAGTGCTGA ATGACGAGGC ATTGAAAGCC 
AGCTGGCTGG CGGAAGTAGA AGAGATGCGT ACTCGCATTC TGGCAATGCG TCAGGAACTG 
GTGAAGGTAT TAAGCACAGA GATGCCAGAA CGCAATTTCG ATTATCTGCT TAATCAGCGC 
GGCATGTTCA GTTATACCGG TTTAAGTGCC GCTCAGGTTG ACCGACTACG TGAAGAATTT 
GGTGTCTATC TCATCGCCAG CGGTCGCATG TGTGTCGCCG GGTTAAATAC GGCAAATGTG 
CAACGTGTGG CAAAGGCGTT TGCTGCGGTG ATGTAA

Protein sequence

MCFNHLPVNL ENHRVFQKVD AYAGDPILTL MERFKEDPRS DKVNLSIGLY YNEDGIIPQL 
KAVAEAEARL NAVPHGASLY LPMEGLNSYR HAIAPLLFGA DHPVLQQQRV ATIQTLGGSG 
ALKVGADFLK RYFPESGVWV SDPTWENHVA IFAGAGFEVS TYPWYDEATN GVRFNDLLAM 
LKTLPARSIV LLHPCCHNPT GADLTNDQWD AVIEILKARE LIPFLDIAYQ GFGAGMEEDA 
YAIRAIASAG LPALVSNSFS KIFSLYGERV GGLSVLCEDA EAAGRVLGQL KATVRRNYSS 
PPNFGAQVVA AVLNDEALKA SWLAEVEEMR TRILAMRQEL VKVLSTEMPE RNFDYLLNQR 
GMFSYTGLSA AQVDRLREEF GVYLIASGRM CVAGLNTANV QRVAKAFAAV M