Gene SeHA_C4516 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4516
Symbol	aceB
ID	6490967
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	4397420
End bp	4399024
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	52%
IMG OID	642744589
Product	malate synthase
Protein accession	YP_002048166
Protein GI	194450851
COG category	[C] Energy production and conversion
COG ID	[COG2225] Malate synthase
TIGRFAM ID	[TIGR01344] malate synthase A

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	0.070236
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAATC CACAGGCAAC CACAACTGAT GAATTAACCT TTACCAGGCC GCAAGGCGAG 
CTGGAAAAGC AAGTCCTGAC CGCTGAAGCA GTCGAGTTTT TGACGGAGTT AGTCACCCGT 
TTTACGCCAA AACGCAATAA ACTCCTGGCT GCACGTATCC AGCAACAGCA GGATATTGAT 
AACGGTAAGT TGCCTGATTT TATTTCGGAA ACCACTTCCA TTAGAGAAAG TAATTGGCAG 
ATTCGTGGTA TTCCGGCGGA TTTACAGGAT CGCCGAGTAG AAATTACCGG GCCGGTTGAA 
CGTAAAATGG TGATTAATGC CCTGAACGCA AATGTGAAAG TGTTTATGGC GGATTTTGAA 
GACTCGCTGG CGCCGGACTG GAATAAAGTT ATTGATGGTC AAATCAACCT GCGTGATGCG 
GTGAACGGCA CCATTAGCTA TACCAACGAA GCCGGAAAAA TCTATCAGCT CAAGCCCGAT 
CCGGCCGTAT TGATTTGTCG TGTACGTGGT CTACATCTGC CAGAAAAACA TGTTACCTGG 
CGGGGGGAAG CCATTCCCGG CAGCCTGTTT GATTTTGCTC TGTACTTTTT CCACAACTAT 
AAAGCGCTGC TCGCTAAAGG TAGCGGCCCG TATTTTTACC TGCCGAAAAC GCAAGCCTGG 
CAGGAGGCAG CCTGGTGGAG CGAAGTCTTC AGCTACGCCG AAGACCGCTT TAACCTGCCG 
CGCGGTACGA TCAAAGCGAC CCTGTTGATT GAAACGCTTC CTGCTGTTTT CCAGATGGAT 
GAGATTCTTC ATGCGTTGCG TGATCATATT GTCGGTCTCA ACTGTGGTCG CTGGGATTAT 
ATTTTCAGCT ATATCAAAAC GTTGAAAAAT CACCCGGATC GCGTCCTGCC GGACAGACAG 
GTGGTAACGA TGGACAAACC GTTTCTGAGC GCCTACTCGC GCCTGCTGAT CAAAACCTGT 
CACAAGCGCG GCGCGTTCGC GATGGGCGGT ATGGCGGCGT TTATCCCGAG CAAAGACGTT 
GAACGCAACA ATCAGGTCCT TGCCAAAGTG AAAGCGGATA AAGCGCTGGA AGCGAACAAC 
GGCCACGACG GCACGTGGAT TGCGCATCCC GGGTTGGCGG ATACCGCAAT GGCCGTCTTT 
AACGAGGTAC TGGGCGAGCA CAAAAATCAG CTGTTCATTA CCCGTGATGA AGATGCGCCG 
ATTACCGCTG AGCAGTTACT GGAGCCATGT GAAGGCGAAC GCACAGAAGC GGGAATGCGC 
GCCAATATTC GCGTGGCAGT GCAGTACATT GAAGCGTGGA TCTCCGGCAA TGGCTGTGTA 
CCGATTTACG GTCTGATGGA GGATGCCGCG ACGGCGGAAA TCTCACGAAC CTCTATCTGG 
CAGTGGATTC ACCATGAGAA AACACTGAGC AATGGAAAAC CCGTAACGAA AGCGCTTTTC 
CGCGAAATGT TGGCGGAAGA GATGCGGGTA ATCCAGGACG AACTGGGCGA GCACCGCTAC 
AGCAGCGGGC GCTTCGACGA TGCCGCACGT CTGATGGAGC AAATCACCAC CTCAGATGAC 
TTAATCGACT TCCTCACCCT GCCGGGCTAT CGCTTACTGG CTTAA

Protein sequence

MMNPQATTTD ELTFTRPQGE LEKQVLTAEA VEFLTELVTR FTPKRNKLLA ARIQQQQDID 
NGKLPDFISE TTSIRESNWQ IRGIPADLQD RRVEITGPVE RKMVINALNA NVKVFMADFE 
DSLAPDWNKV IDGQINLRDA VNGTISYTNE AGKIYQLKPD PAVLICRVRG LHLPEKHVTW 
RGEAIPGSLF DFALYFFHNY KALLAKGSGP YFYLPKTQAW QEAAWWSEVF SYAEDRFNLP 
RGTIKATLLI ETLPAVFQMD EILHALRDHI VGLNCGRWDY IFSYIKTLKN HPDRVLPDRQ 
VVTMDKPFLS AYSRLLIKTC HKRGAFAMGG MAAFIPSKDV ERNNQVLAKV KADKALEANN 
GHDGTWIAHP GLADTAMAVF NEVLGEHKNQ LFITRDEDAP ITAEQLLEPC EGERTEAGMR 
ANIRVAVQYI EAWISGNGCV PIYGLMEDAA TAEISRTSIW QWIHHEKTLS NGKPVTKALF 
REMLAEEMRV IQDELGEHRY SSGRFDDAAR LMEQITTSDD LIDFLTLPGY RLLA