Gene EcSMS35_3895 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3895
Symbol	avtA
ID	6143413
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	3965775
End bp	3967028
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	52%
IMG OID	641618721
Product	valine--pyruvate transaminase
Protein accession	YP_001745860
Protein GI	170683665
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3977] Alanine-alpha-ketoisovalerate (or valine-pyruvate) aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATTCT CCCTTTTTGG TGACAAATTT ACCCGCCACT CCGGCATTAC GCTGCTGATG 
GAAGATCTGA ACGACGGTTT ACGCACGCCT GGCGCGATTA TGCTCGGCGG CGGTAATCCA 
GCGCAGATCC CGGAAATGCA GGACTACTTC CAGACGCTAC TGACCGACAT GCTGGAAAGT 
GGCAAAGCGA CTGATGCACT GTGCAATTAC GACGGTCCAC AGGGGAAAAC GGAGCTACTC 
ACACTGCTTG CCGGAATGCT GCGCGAGAAG TTGGGTTGGG ATATCGAACC ACAGAATATT 
GCACTAACAA ACGGCAGCCA GAGCGCGTTT TTCTACTTAT TTAATCTGTT TGCCGGACGC 
CGTGCCGATG GTCGGATCAA AAAAGTGCTG TTTCCGCTGG CACCGGAATA TATTGGCTAC 
GCTGACGCCG GACTGGAAGA AGATCTGTTT GTCTCTGCGC GTCCGAATAT TGAACTGCTG 
CCGGAAGGCC AGTTTAAATA CCACGTCGAT TTTGAGCATC TGCATATTGG CGAAGAAACC 
GGGATGATTT GCGTCTCCCG GCCGACGAAT CCAACAGGCA ATGTGATTAC TGACGAAGAG 
TTGCTGAAGC TTGACGCGCT GGCGAATCAA CACGGCATTC CGCTGGTGAT TGATAACGCT 
TATGGCGTCC CGTTCCCGGG TATCATCTTC AGCGAAGCGC GCCCGCTGTG GAATCCGAAT 
ATTGTACTGT GCATGAGTCT TTCCAAGCTG GGACTACCGG GTTCGCGCTG CGGCATTATC 
ATCGCCAATG AAAAAATCAT CACCGCAATC ACCAACATGA ACGGCATTAT CAGCCTGGCG 
CCTGGCGGTA TTGGTCCGGC GATAATGTGT GAAATGATTA AGCGTAACGA TCTGCTGCGC 
CTGTCTGAAA CGGTTATCAA ACCGTTTTAT TACCAGCGTG TTCAGGAAAC TATCGCCATC 
ATTCGCCGCT ATTTACCGGA AGATCGCTGC CTGATTCATA AACCGGAAGG AGCCATTTTC 
CTCTGGCTAT GGTTTAAGGA TTTGCCAATT ACGACCGAGC AGCTCTACCA GCGCCTGAAA 
GCACGGGGCG TGCTGATGGT GCCGGGGCAC AACTTCTTCC CAGGGCTGGA TAAACCGTGG 
CCACATACAC ATCAATGTAT GCGCATGAAC TACGTGCCGG AGCCGGATAA AATTGAGGCG 
GGGGTGAAGA TTCTGGCGGA AGAGATTGAA CGCGCCTGGG CTGAAAGTCA TTAA

Protein sequence

MTFSLFGDKF TRHSGITLLM EDLNDGLRTP GAIMLGGGNP AQIPEMQDYF QTLLTDMLES 
GKATDALCNY DGPQGKTELL TLLAGMLREK LGWDIEPQNI ALTNGSQSAF FYLFNLFAGR 
RADGRIKKVL FPLAPEYIGY ADAGLEEDLF VSARPNIELL PEGQFKYHVD FEHLHIGEET 
GMICVSRPTN PTGNVITDEE LLKLDALANQ HGIPLVIDNA YGVPFPGIIF SEARPLWNPN 
IVLCMSLSKL GLPGSRCGII IANEKIITAI TNMNGIISLA PGGIGPAIMC EMIKRNDLLR 
LSETVIKPFY YQRVQETIAI IRRYLPEDRC LIHKPEGAIF LWLWFKDLPI TTEQLYQRLK 
ARGVLMVPGH NFFPGLDKPW PHTHQCMRMN YVPEPDKIEA GVKILAEEIE RAWAESH