Gene SeD_A4049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4049
Symbol	avtA
ID	6873703
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	3892980
End bp	3894230
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	53%
IMG OID	642786998
Product	valine--pyruvate transaminase
Protein accession	YP_002217625
Protein GI	198242924
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3977] Alanine-alpha-ketoisovalerate (or valine-pyruvate) aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	0.714309
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATTTT CACTTTTCGG CGATAAATTT ACCCGCCATT CAGGCATTAC CCGCCTGATG 
GAGGATCTCA ACGACGGCTT ACGCACGCCA GGCGCCATCA TGCTTGGCGG CGGTAACCCG 
GCACACATCC CTGCAATGCA GGATTATTTC CAGACGCTAC TGACAGATAT GGTAGAAAGC 
GGCAAAGCCG CTGATGCGCT TTGTAATTAT GACGGTCCCC AGGGAAAAAC GGCGCTACTG 
AATGCACTGG CCGTACTGCT ACGTGAAACG CTGGGATGGG ATATCGAACC ACAGAATATT 
GCGCTGACAA ATGGCAGTCA GAGCGCGTTT TTCTACTTAT TTAATCTCTT CGCCGGACGT 
CGCGCCGACG GCAGTACGAA AAAGGTACTA TTCCCGCTTG CGCCGGAATA CATCGGCTAT 
GCAGATTCCG GTCTGGAAGA CGACCTCTTC GTTTCGGCGC GCCCGAATAT TGAGCTGCTG 
CCGGAAGGCC AGTTTAAGTA TCACGTCGAT TTTGAGCATC TGCACATCGG CGAAGAAACG 
GGGATGATTT GCGTCTCGCG CCCGACCAAC CCAACCGGTA ACGTTATCAC CGACGAAGAG 
CTGATGAAGC TGGACAGACT GGCGAATCAG CACAACATCC CACTGGTGAT TGATAACGCT 
TACGGTGTAC CGTTTCCGGG CATTATCTTT AGCGAGGCGC GCCCGCTGTG GAACCCCAAT 
ATTATCCTAT GCATGAGCCT CTCGAAGCTG GGGCTGCCCG GTTCCCGCTG CGGGATTATC 
ATCGCCAATG ATAAGACGAT TACCGCCATT GCCAACATGA ACGGCATCAT CAGCCTTGCG 
CCCGGGGGCA TGGGCCCGGC GATGATGTGC GAAATGATTA AGCGTAACGA TCTGCTGCGG 
CTGTCGGAAA CGGTTATCAA ACCTTTCTAC TATCAGCGCG TTCAACAGAC GATCGCGATC 
ATTCGTCGCT ATTTATCCGA AGAACGCTGC CTGATTCATA AACCGGAAGG CGCAATATTT 
TTGTGGCTGT GGTTTAAAGA TCTGCCGATT ACCACCGAGC TACTCTATCA ACGCTTGAAA 
GCGCGCGGCG TGCTGATGGT GCCAGGCCAC TATTTCTTTC CCGGACTGGA TAAACCCTGG 
CCGCACACAC ACCAGTGTAT GCGGATGAAC TACGTGCCTG AACCGGACAA AATCGAGGCG 
GGCGTAAAAA TTCTGGCAGA AGAGATTGAA CGCGCCTGGC GTGAAGGCTG A

Protein sequence

MTFSLFGDKF TRHSGITRLM EDLNDGLRTP GAIMLGGGNP AHIPAMQDYF QTLLTDMVES 
GKAADALCNY DGPQGKTALL NALAVLLRET LGWDIEPQNI ALTNGSQSAF FYLFNLFAGR 
RADGSTKKVL FPLAPEYIGY ADSGLEDDLF VSARPNIELL PEGQFKYHVD FEHLHIGEET 
GMICVSRPTN PTGNVITDEE LMKLDRLANQ HNIPLVIDNA YGVPFPGIIF SEARPLWNPN 
IILCMSLSKL GLPGSRCGII IANDKTITAI ANMNGIISLA PGGMGPAMMC EMIKRNDLLR 
LSETVIKPFY YQRVQQTIAI IRRYLSEERC LIHKPEGAIF LWLWFKDLPI TTELLYQRLK 
ARGVLMVPGH YFFPGLDKPW PHTHQCMRMN YVPEPDKIEA GVKILAEEIE RAWREG