Gene ECH74115_4948 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4948
Symbol	avtA
ID	6970805
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	4588892
End bp	4590145
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	53%
IMG OID	643388631
Product	valine--pyruvate transaminase
Protein accession	YP_002273058
Protein GI	209398430
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3977] Alanine-alpha-ketoisovalerate (or valine-pyruvate) aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	0.458288
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATTCT CCCTTTTTGG TGACAAATTT ACCCGCCACT CCGGCATTAC GCTGCTGATG 
GAAGATCTGA ACGACGGTTT ACGCACGCCT GGCGCGATTA TGCTCGGCGG CGGTAATCCG 
GCGCAGATCC CGGAAATGCA GGACTACTTC CAGACGCTAC TGACCGACAT GCTGGAAAGT 
GGCAAAGCGA CTGATGCACT GTGCAATTAC GACGGTCCAC AGGGGAAAAC GGAGCTACTC 
ACACTGCTTG CCGGAATGCT GCGCGAGAAG TTGGGTTGGG ATATCGAAGC ACAGAATATT 
GCACTAACAA ACGGCAGCCA GAGCGCGTTT TTCTACTTAT TTAATCTGTT TGCCGGACGC 
CGTGCCGATG GTCGGGTCAA AAAAGTGCTG TTCCCGCTGG CACCGGAATA CATTGGCTAC 
GCTGACGCCG GACTGGAAGA AGATCTGTTT GTCTCTGCGC GTCCGAATAT TGAACTGCTG 
CCGGAAGGCC AGTTTAAATA CCACGTCGAT TTTGAGCATC TGCATATTGG CGAAGAAACC 
GGGATGATTT GCGTCTCCCG GCCGACGAAT CCAACAGGCA ATGTGATTAC TGACGAAGAG 
TTGCTGAAGC TTGACGCGCT GGCGAATCAA CACGGCATTC CGCTGGTGAT TGATAACGCT 
TATGGCGTCC CGTTCCCGGG TATCATCTTC AGTGAAGCGC GCCCGCTATG GAATCCGAAT 
ATCGTGCTGT GCATGAGTCT TTCCAAGCTG GGGCTGCCTG GCTCCCGCTG CGGCATTATC 
ATCGCCAATG AAAAAATCAT CACCGCCATC ACCAATATGA ACGGCATTAT CAGCCTGGCA 
CCTGGCGGTA TTGGTCCGGC GATGATGTGT GAAATGATTA AGCGTAACGA TCTGCTGCGC 
CTGTCTGAAA CAGTCATCAA ACCGTTTTAC TACCAGCGTG TTCAGGAAAC TATCGCCATC 
ATTCGCCGCT ATTTACCGGA AGATCGCTGC CTAATTCATA AACCAGAAGG AGCCATTTTC 
CTCTGGCTTT GGTTTAAGGA TTTGCCCATT ACGACCGAGC AGCTCTATCA GCGCCTGAAA 
GCACGCGGCG TGCTGATGGT GCCGGGGCAC AACTTCTTCC CAGGGCTGGA CAAACCGTGG 
CCGCATACGC ATCAATGTAT GCGCATGAAC TACGTACCAG AGCCGGAGAA AATTGAGGCG 
GGGGTGAAGA TTCTGGCGGA AGAGATAGAA AGAGCCTGGG CTGAAAGTCA CTAA

Protein sequence

MTFSLFGDKF TRHSGITLLM EDLNDGLRTP GAIMLGGGNP AQIPEMQDYF QTLLTDMLES 
GKATDALCNY DGPQGKTELL TLLAGMLREK LGWDIEAQNI ALTNGSQSAF FYLFNLFAGR 
RADGRVKKVL FPLAPEYIGY ADAGLEEDLF VSARPNIELL PEGQFKYHVD FEHLHIGEET 
GMICVSRPTN PTGNVITDEE LLKLDALANQ HGIPLVIDNA YGVPFPGIIF SEARPLWNPN 
IVLCMSLSKL GLPGSRCGII IANEKIITAI TNMNGIISLA PGGIGPAMMC EMIKRNDLLR 
LSETVIKPFY YQRVQETIAI IRRYLPEDRC LIHKPEGAIF LWLWFKDLPI TTEQLYQRLK 
ARGVLMVPGH NFFPGLDKPW PHTHQCMRMN YVPEPEKIEA GVKILAEEIE RAWAESH