Gene SeD_A1037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A1037
Symbol	pflB2
ID	6872972
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	1035069
End bp	1037351
Gene Length	2283 bp
Protein Length	760 aa
Translation table	11
GC content	52%
IMG OID	642784222
Product	formate acetyltransferase
Protein accession	YP_002214896
Protein GI	198241907
COG category	[C] Energy production and conversion
COG ID	[COG1882] Pyruvate-formate lyase
TIGRFAM ID	[TIGR01255] formate acetyltransferase 1

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0101477
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	0.620237
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGAGC TTAATGAAAA GTTAGCCACA GCCTGGGAAG GTTTTACCAA AGGTGACTGG 
CAGAATGAAG TAAACGTCCG TGACTTCATT CAGAAAAACT ACACTCCGTA TGAGGGTGAC 
GAGTCCTTCC TGGCTGGCGC TACTGACGCG ACCACCAAGC TGTGGGACAG CGTAATGGAA 
GGCGTTAAAC AGGAAAACCG CACTCACGCG CCTGTTGACT TTGACACCTC CGTTGCTTCC 
ACCATCACTT CTCACGACGC TGGCTACATC AACAAAGCGC TTGAGAAAAT TGTTGGTCTG 
CAGACTGAAG CTCCGCTGAA GCGTGCGATT ATCCCGTTCG GCGGCATCAA AATGGTTGAA 
GGTTCCTGCA AAGCGTACAA TCGCGAGCTG GACCCAATGA TCAAAAAAAT CTTCACCGAA 
TACCGTAAGA CTCACAACCA GGGCGTGTTC GACGTTTATA CTCCGGACAT CCTGCGTTGC 
CGTAAATCCG GCGTTCTGAC CGGTCTGCCG GATGCGTATG GCCGTGGCCG TATCATCGGT 
GACTACCGTC GCGTAGCGCT GTACGGTATC GACTACCTGA TGAAAGACAA ATTCGCACAG 
TTTACGTCTC TGCAATCCGA TCTGGAAAAC GGCGTAAATC TGGAAGCGAC TATCCGTCTG 
CGTGAAGAAA TCGCTGAACA GCACCGCGCT CTGGGTCAGA TCAAAGAAAT GGCAGCTAAA 
TACGGCTGCG ATATCTCTGG TCCGGCGACT AACGCTCAGG AAGCAATCCA GTGGACTTAC 
TTCGGTTACC TGGCTGCGGT TAAATCTCAG AACGGCGCAG CAATGTCCTT CGGTCGTGTA 
TCCACCTTCC TGGATGCGTA CATCGAACGT GACCTGAAAG CAGGCAAAAT CACCGAGCAA 
GACGCACAGG AAATGATTGA CCACCTGGTC ATGAAACTGC GTATGGTTCG CTTCCTGCGT 
ACTCCTGAAT ATGATGAACT GTTCTCCGGC GACCCGATTT GGGCAACCGA ATCTATCGGC 
GGTATGGGCG TTGATGGCCG TACTCTGGTC ACCAAAAACA GCTTCCGTTT CCTGAACACC 
CTGTACACCA TGGGGCCGTC TCCGGAGCCG AACATCACCG TTCTGTGGTC TGAAAAACTG 
CCGCTGAACT TCAAGAAATT CGCCGCTAAA GTCTCCATCG ACACCTCTTC TCTGCAGTAC 
GAGAACGATG ACCTGATGCG TCCGGACTTC AACAACGATG ACTACGCTAT CGCATGCTGC 
GTAAGCCCGA TGATCGTTGG TAAACAAATG CAGTTCTTCG GCGCGCGTGC AAACCTGGCG 
AAAACCATGC TGTACGCTAT CAACGGCGGC GTTGATGAAA AACTGAAAAT GCAGGTTGGT 
CCGAAATCCG AACCGATCAA AGGCGATGTT CTGAACTTCG ACGAAGTGAT GGATCGCATG 
GATCACTTCA TGGACTGGCT GGCTAAACAG TATGTCACCG CGCTGAACGT TATCCACTAC 
ATGCACGACA AGTACAGCTA CGAAGCCTCT CTGATGGCGC TGCACGACCG TGACGTTATC 
CGCACCATGG CGTGTGGTAT CGCAGGTCTG TCCGTTGCTG CTGACTCCCT GTCTGCCATC 
AAATATGCGA AAGTTAAACC GATTCGTGAC GAAGATGGTC TGGCTATCGA CTTCGAAATC 
GAAGGCGAAT ACCCGCAGTT TGGTAACAAC GACGCTCGTG TAGATGACAT GGCGGTTGAC 
CTGGTAGAAC GTTTCATGAA GAAAATTCAG AAACTGACCA CCTACCGTGG CGCTATCCCG 
ACGCAGTCTG TTCTGACCAT CACTTCTAAC GTTGTGTATG GTAAGAAAAC CGGTAACACC 
CCGGATGGTC GTCGCGCTGG CGCGCCGTTC GGACCAGGTG CTAACCCGAT GCACGGTCGT 
GACCAGAAAG GCGCTGTCGC TTCTCTGACC TCCGTTGCTA AACTGCCGTT TGCTTACGCG 
AAAGATGGTA TTTCTTATAC CTTCTCTATC GTTCCGAACG CACTGGGTAA AGACGACGAA 
GTTCGTAAGA CTAACCTGGC AGGTCTGATG GATGGTTACT TCCACCACGA AGCGTCCATC 
GAAGGCGGTC AGCACCTGAA CGTCAACGTC ATGAACCGTG AAATGCTGCT GGACGCGATG 
GAACATCCGG AAAAATATCC GCAGCTGACC ATCCGTGTAT CTGGTTACGC AGTACGTTTT 
AACTCCCTGA CGAAAGAACA GCAGCAGGAC GTTATTACTC GTACCTTCAC GCAGACCATG 
TAA

Protein sequence

MSELNEKLAT AWEGFTKGDW QNEVNVRDFI QKNYTPYEGD ESFLAGATDA TTKLWDSVME 
GVKQENRTHA PVDFDTSVAS TITSHDAGYI NKALEKIVGL QTEAPLKRAI IPFGGIKMVE 
GSCKAYNREL DPMIKKIFTE YRKTHNQGVF DVYTPDILRC RKSGVLTGLP DAYGRGRIIG 
DYRRVALYGI DYLMKDKFAQ FTSLQSDLEN GVNLEATIRL REEIAEQHRA LGQIKEMAAK 
YGCDISGPAT NAQEAIQWTY FGYLAAVKSQ NGAAMSFGRV STFLDAYIER DLKAGKITEQ 
DAQEMIDHLV MKLRMVRFLR TPEYDELFSG DPIWATESIG GMGVDGRTLV TKNSFRFLNT 
LYTMGPSPEP NITVLWSEKL PLNFKKFAAK VSIDTSSLQY ENDDLMRPDF NNDDYAIACC 
VSPMIVGKQM QFFGARANLA KTMLYAINGG VDEKLKMQVG PKSEPIKGDV LNFDEVMDRM 
DHFMDWLAKQ YVTALNVIHY MHDKYSYEAS LMALHDRDVI RTMACGIAGL SVAADSLSAI 
KYAKVKPIRD EDGLAIDFEI EGEYPQFGNN DARVDDMAVD LVERFMKKIQ KLTTYRGAIP 
TQSVLTITSN VVYGKKTGNT PDGRRAGAPF GPGANPMHGR DQKGAVASLT SVAKLPFAYA 
KDGISYTFSI VPNALGKDDE VRKTNLAGLM DGYFHHEASI EGGQHLNVNV MNREMLLDAM 
EHPEKYPQLT IRVSGYAVRF NSLTKEQQQD VITRTFTQTM