Gene EcolC_0142 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0142
Symbol	avtA
ID	6068302
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	153868
End bp	155121
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	52%
IMG OID	641599542
Product	valine--pyruvate transaminase
Protein accession	YP_001723151
Protein GI	170018197
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3977] Alanine-alpha-ketoisovalerate (or valine-pyruvate) aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATTCT CCCTTTTTGG TGACAAATTT ACCCGCCACT CCGGCATTAC GCTGTTGATG 
GAAGATCTGA ACGACGGTTT ACGCACGCCT GGCGCGATTA TGCTCGGCGG CGGTAATCCG 
GCGCAGATCC CGGAAATGCA GGACTACTTC CAGACGCTAC TGACCGACAT GCTGGAAAGT 
GGCAAAGCGA CTGATGCACT GTGTAACTAC GACGGTCCAC AGGGGAAAAC GGAGCTACTC 
ACACTGCTTG CCGGAATGCT GCGCGAGAAG TTGGGTTGGG ATATCGAACC ACAGAATATT 
GCACTAACAA ACGGCAGCCA GAGCGCGTTT TTCTACTTAT TTAACCTGTT TGCCGGACGC 
CGTGCCGATG GTCGGGTCAA AAAAGTGCTG TTCCCGCTTG CACCGGAATA CATTGGCTAT 
GCTGACGCCG GACTGGAAGA AGATCTGTTT GTCTCTGCGC GTCCGAATAT TGAACTGCTG 
CCGGAAGGCC AGTTTAAATA CCACGTCGAT TTTGAGCATC TGCATATTGG CGAAGAAACC 
GGGATGATTT GCGTCTCCCG GCCGACGAAT CCAACAGGCA ATGTGATTAC TGACGAAGAG 
TTGCTGAAGC TTGACGCGCT GGCGAATCAA CACGGCATTC CGCTGGTGAT TGATAACGCT 
TATGGCGTCC CGTTCCCGGG TATCATCTTC AGTGAAGCGC GCCCGCTATG GAATCCGAAT 
ATCGTGCTGT GCATGAGTCT TTCCAAGCTG GGTCTACCTG GCTCCCGCTG CGGCATTATC 
ATCGCCAATG AAAAAATCAT CACCGCCATC ACCAATATGA ACGGCATTAT CAGCCTGGCA 
CCTGGCGGTA TTGGTCCGGC GATGATGTGT GAAATGATTA AGCGTAACGA TCTGCTGCGC 
CTGTCTGAAA CAGTCATCAA ACCGTTTTAC TACCAGCGTG TTCAGGAAAC TATCGCCATC 
ATTCGCCGCT ATTTACCGGA AAATCGCTGC CTGATTCATA AACCGGAAGG AGCCATTTTC 
CTCTGGCTAT GGTTTAAGGA TTTGCCCATT ACGACCGAGC AGCTCTATCA GCGCCTGAAA 
GCACGCGGCG TGCTGATGGT GCCGGGGCAC AACTTCTTCC CAGGGCTGGA TAAACCGTGG 
CCGCATACGC ATCAATGTAT GCGCATGAAC TACGTACCAG AGCCGGAGAA AATTGAGGCG 
GGGGTGAAGA TTCTGGCGGA AGAGATAGAA AGAGCCTGGG CTGAAAGTCA CTAA

Protein sequence

MTFSLFGDKF TRHSGITLLM EDLNDGLRTP GAIMLGGGNP AQIPEMQDYF QTLLTDMLES 
GKATDALCNY DGPQGKTELL TLLAGMLREK LGWDIEPQNI ALTNGSQSAF FYLFNLFAGR 
RADGRVKKVL FPLAPEYIGY ADAGLEEDLF VSARPNIELL PEGQFKYHVD FEHLHIGEET 
GMICVSRPTN PTGNVITDEE LLKLDALANQ HGIPLVIDNA YGVPFPGIIF SEARPLWNPN 
IVLCMSLSKL GLPGSRCGII IANEKIITAI TNMNGIISLA PGGIGPAMMC EMIKRNDLLR 
LSETVIKPFY YQRVQETIAI IRRYLPENRC LIHKPEGAIF LWLWFKDLPI TTEQLYQRLK 
ARGVLMVPGH NFFPGLDKPW PHTHQCMRMN YVPEPEKIEA GVKILAEEIE RAWAESH