Gene SbBS512_E3950 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E3950
Symbol	avtA
ID	6268965
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	3682798
End bp	3684051
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	53%
IMG OID	641727799
Product	valine--pyruvate transaminase
Protein accession	YP_001882232
Protein GI	187730702
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3977] Alanine-alpha-ketoisovalerate (or valine-pyruvate) aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACATTCT CCCTTTTTGG TGACAAATTT ACCCGCCACT CCGGCATTAC GCTGCTGATG 
GAAGATCTGA ACGACGGTTT ACGCACGCCT GGCGCGATTA TGCTCGGCGG CGGTAATCCG 
GCGCAGATCC CGGAAATGCA GGACTACTTC CAGACGCTAC TCACCGACAT GCTGGAAAGT 
GGCAAAGCGA CTGATGCACT GTGTAACTAC GACGGTCCAC AGGGGAAAAC GGAGCTACTC 
ACACTGCTTG CCGGAATGCT GCGCGAGAAG TTGGGTTGGG ATATCGAACC ACAGAATATT 
GCACTAACAA ACGGCAGCCA GAGCGCGTTT TTCTACTTAT TTAACCTGTT TGCCGGACGC 
CGTGCCGATG GTCGGGTCAA AAAAGTGCTG TTCCCGCTGG CACCGGAATA CATTGGCTAC 
GCTGACGCCG GACTGGAAGA AGATCTGTTT GTCTCTGCGC GTCCGAATAT TGAACTGCTG 
CCGGAAGGCC AGTTTAAATA CCACGTCGAT TTTGAGCATC TGCATATTGG CGAAGAAACC 
GGGATGATTT GCGTCTCCCG GCCGACGAAT CCAACAGGCA ATGTGATTAC TGACGAAGAG 
TTGCTGAAGC TTGACGCGCT GGCGAATCAA CACGGCATTC CGCTGGTGAT TGATAACGCT 
TATGGCGTCC CGTTCCCGGG TATCATCTTC AGTGAAGCGC GCCCGCTATG GAATCCGAAT 
ATCGTGCTGT GCATGAGTCT TTCCAAGCTG GGGCTGCCTG GCTCCCGCTG CGGCATTATC 
ATCGCCAATG AAAAAATCAT CACTGCCATC ACCAATATGA ACGGCATTAT CAGCCTGGCA 
CCTGGCGGTA TTGGTCCGGC GATGATGTGT GAAATGATTA AGCGTAACGA TCTGCTGCGC 
CTGTCTGAAA CAGTCATCAA ACCGTTTTAC TACCAGCGTG TTCAGGAAAC TATCGCCATC 
ATTCGCCGCT ATTTACCGGA AAATCGCTGC CTGATTCATA AACCGGAAGG AGCCATTTTC 
CTCTGGCTAT GGTTTAAGGA TTTGCCCATT ACGACCGAGC AGCTCTATCA GCGCCTGAAA 
GCACGCGGCG TGCTGATGGT GCCGGGGCAC AACTTCTTCC CGGGACTGGA TAAACCGTGG 
CCGCATACGC ATCAATGTAT GCGCATGAAC TACGTACCAG AGCCGGAGAA AATTGAGGCG 
GGGGTGAAGA TTCTGGCGGA AGAGATAGAA AGAGCCTGGG CAGAAAGTCA CTAA

Protein sequence

MTFSLFGDKF TRHSGITLLM EDLNDGLRTP GAIMLGGGNP AQIPEMQDYF QTLLTDMLES 
GKATDALCNY DGPQGKTELL TLLAGMLREK LGWDIEPQNI ALTNGSQSAF FYLFNLFAGR 
RADGRVKKVL FPLAPEYIGY ADAGLEEDLF VSARPNIELL PEGQFKYHVD FEHLHIGEET 
GMICVSRPTN PTGNVITDEE LLKLDALANQ HGIPLVIDNA YGVPFPGIIF SEARPLWNPN 
IVLCMSLSKL GLPGSRCGII IANEKIITAI TNMNGIISLA PGGIGPAMMC EMIKRNDLLR 
LSETVIKPFY YQRVQETIAI IRRYLPENRC LIHKPEGAIF LWLWFKDLPI TTEQLYQRLK 
ARGVLMVPGH NFFPGLDKPW PHTHQCMRMN YVPEPEKIEA GVKILAEEIE RAWAESH