Gene SNSL254_A4519 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A4519
Symbol	aceB
ID	6483073
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	4392194
End bp	4393798
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	52%
IMG OID	642739745
Product	malate synthase
Protein accession	YP_002043427
Protein GI	194442437
COG category	[C] Energy production and conversion
COG ID	[COG2225] Malate synthase
TIGRFAM ID	[TIGR01344] malate synthase A

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.492257
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	83
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAATC CACAGGCAAC CACAACTGAT GAATTAACCT TTACCAGGCC GCAAGGCGAG 
CTGGAAAAGC AAGTCCTGAC CGCTGAAGCA GTCGAGTTTT TGACGGAGTT AGTCACCCGT 
TTTACGCCAA AACGCAATAA ACTCCTGGCT GCACGTATCC AGCAACAGCA GGATATTGAT 
AACGGTAAGT TGCCTGATTT TATTTCGGAA ACCACTTCCA TTAGAGAAAG TAATTGGCAG 
ATTCGTGGTA TTCCGGCGGA TTTACAGGAT CGCCGAGTAG AAATTACCGG GCCGGTTGAA 
CGTAAAATGG TGATTAATGC CCTGAACGCA AACGTGAAAG TGTTTATGGC GGATTTTGAA 
GACTCGCTGG CGCCGGACTG GAATAAAGTT ATTGATGGTC AAATCAACCT GCGTGATGCG 
GTGAACGGCA CCATTAGCTA TACCAACGAA GCCGGAAAAA TCTATCAGCT CAAGCCCGAT 
CCGGCCGTAT TGATTTGTCG TGTACGCGGT CTACATCTGC CAGAAAAACA TGTTACCTGG 
CGGGGGGAAG CTATTCCCGG CAGCCTGTTT GATTTTGCTC TGTACTTTTT CCACAACTAT 
AAAGCGCTGC TCGCTAAAGG TAGCGGCCCG TATTTTTACC TGCCGAAAAC GCAAGCCTGG 
CAGGAGGCAG CCTGGTGGAG TGAAGTTTTC AGCTACGCCG AAGACCGCTT TAACCTGCCG 
CGCGGTACGA TCAAAGCGAC CCTGTTGATT GAAACGCTGC CGGCTGTTTT CCAGATGGAT 
GAGATTCTTC ATGCGCTGCG TGATCATATC GTCGGTCTCA ACTGTGGTCG CTGGGATTAT 
ATTTTCAGCT ATATCAAAAC GTTGAAAAAT CACCCGGATC GCGTCCTGCC GGACAGGCAG 
GTGGTAACGA TGGACAAACC GTTTCTGAGC GCCTACTCGC GCCTGCTGAT CAAAACCTGT 
CACAAGCGCG GCGCGTTCGC GATGGGCGGT ATGGCGGCGT TTATCCCGAG CAAAGACGTT 
GAACGCAACA ATCAGGTCCT TGCCAAAGTG AAAGCGGATA AAGCGCTGGA AGCGAACAAC 
GGCCACGACG GCACGTGGAT TGCGCATCCC GGGTTGGCGG ATACCGCAAT GGCCGTCTTT 
AACGAGGTAC TGGGCGAGCA CAAAAATCAG CTGTTCATTA CCCGTGATGA AGATGCGCCG 
ATTACCGCTG AACAGTTACT GGAGCCATGT GAAGGCGAAC GCACAGAAGC GGGAATGCGC 
GCCAATATTC GCGTGGCAGT GCAGTACATT GAAGCGTGGA TCTCCGGCAA TGGCTGTGTA 
CCGATTTACG GTCTGATGGA GGATGCCGCG ACGGCGGAAA TCTCACGAAC CTCTATCTGG 
CAGTGGATTC ACCATGAGAA AACACTGAGC AATGGAAAAC CCGTAACGAA AGCGCTTTTC 
CGCGAAATGT TGGCGGAAGA GATGCGGGTA ATCCAGGACG AGCTGGGCGA GCACCGCTAC 
AGCAGCGGGC GCTTCGACGA TGCCGCACGT CTGATGGAGC AAATCACCAC CTCAGATGAC 
TTAATCGACT TCCTCACCCT GCCGGGCTAT CGCTTACTGG CTTAA

Protein sequence

MMNPQATTTD ELTFTRPQGE LEKQVLTAEA VEFLTELVTR FTPKRNKLLA ARIQQQQDID 
NGKLPDFISE TTSIRESNWQ IRGIPADLQD RRVEITGPVE RKMVINALNA NVKVFMADFE 
DSLAPDWNKV IDGQINLRDA VNGTISYTNE AGKIYQLKPD PAVLICRVRG LHLPEKHVTW 
RGEAIPGSLF DFALYFFHNY KALLAKGSGP YFYLPKTQAW QEAAWWSEVF SYAEDRFNLP 
RGTIKATLLI ETLPAVFQMD EILHALRDHI VGLNCGRWDY IFSYIKTLKN HPDRVLPDRQ 
VVTMDKPFLS AYSRLLIKTC HKRGAFAMGG MAAFIPSKDV ERNNQVLAKV KADKALEANN 
GHDGTWIAHP GLADTAMAVF NEVLGEHKNQ LFITRDEDAP ITAEQLLEPC EGERTEAGMR 
ANIRVAVQYI EAWISGNGCV PIYGLMEDAA TAEISRTSIW QWIHHEKTLS NGKPVTKALF 
REMLAEEMRV IQDELGEHRY SSGRFDDAAR LMEQITTSDD LIDFLTLPGY RLLA