Gene SeD_A0147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A0147
Symbol
ID	6874109
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	157529
End bp	158518
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	54%
IMG OID	642783395
Product	aldo-keto reductase YakC
Protein accession	YP_002214089
Protein GI	198243518
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	77
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATATC GTACATTAGG CGCAAACGGA CCGCGAGTGT CAGCCATCGG ACTGGGATGT 
ATGGGCATGA GCGCATTTTA CGGCGCTCAT GACGACAGCA CCTCAATTAA GACGCTACAT 
TATGCGTTAG ATCAGGGGGT AACACTGCTC GATACCGCAG ATATGTATGG CCCTTATACC 
AATGAAAGGT TAGTTGGAAG AGCCATCGCC GATCGTCGCG ATCGGGTATT TTTAGCGACG 
AAATTTGGTA TCGTTCTCGA CCCTGCTAAC CCTATGGCGC GTGGCGTCAA TGGCAGACCG 
GAGTACGTTC GCCGTAGTTG TGAGCAAAGC CTGCAACGCC TGGGGGTCGA TCATATCGAT 
CTGTACTATC AACATCGCGT TGATCCATCA GTTCCCATAG GAGAGACTGT CGGTGCAATG 
GCGGACCTGG TGCGCGAGGG AAAAGTGCGT TATCTCGGGC TATCCGAAGC ATCAACGCAA 
ACGCTGGAAC GCGCCCATAA CGTTCACCCT ATTACCGCGC TGCAAAGTGA GTATTCGCTT 
TGGTCCCGCG AAGCGGAAAT TTCAGCACTT TCCACCTGTG AACGGTTGGG TATAGGATTC 
GTCGCTTACA GCCCGCTGGG ACGCGGATTT CTGACCGGTA CGATTAAAAC GCCAGAAGAT 
TTTGCTGCGA ATGACTTCCG TCGCACAAAT CCCAGGTTCA TGGGTGAGAA CTTCTCGCGC 
AATTTACGTC TGGCTGAAGC AATAAAACAA ATGGCACGCG AAAAAGAGTG TACCCCCGCA 
CAATTAGCGC TGGCCTGGCT GCTGGCCCGC AACAGGCACA TCGTTCCCAT TCCCGGCACC 
CGCCACTGCG CCAGGGTGGA TGAAAACCTC GGCGCGTTAT CACTGACCCT AAGCCCGCAG 
GAGCTGACGG CAATTGAGGC GGTTTTTCCT CACGACGCCG CGGCCGGCCC CCGCTACTGG 
CCGGAAATTA TGTCGACATT AAATCGCTAA

Protein sequence

MQYRTLGANG PRVSAIGLGC MGMSAFYGAH DDSTSIKTLH YALDQGVTLL DTADMYGPYT 
NERLVGRAIA DRRDRVFLAT KFGIVLDPAN PMARGVNGRP EYVRRSCEQS LQRLGVDHID 
LYYQHRVDPS VPIGETVGAM ADLVREGKVR YLGLSEASTQ TLERAHNVHP ITALQSEYSL 
WSREAEISAL STCERLGIGF VAYSPLGRGF LTGTIKTPED FAANDFRRTN PRFMGENFSR 
NLRLAEAIKQ MAREKECTPA QLALAWLLAR NRHIVPIPGT RHCARVDENL GALSLTLSPQ 
ELTAIEAVFP HDAAAGPRYW PEIMSTLNR