Gene SeD_A3336 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A3336
Symbol	tas
ID	6871857
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	3213297
End bp	3214337
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	55%
IMG OID	642786343
Product	putative aldo-keto reductase
Protein accession	YP_002216982
Protein GI	198244370
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.697041
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.0101445
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACTATC ACCGTATACC CCACAGCTCG CTCGAAGTAA GTACGCTAGG GCTGGGCACA 
ATGACATTTG GTGAACAAAA CAGCGAAGCC GACGCTCACG CACAGCTCGA CTATGCCATC 
GCAAATGGCA TTAACCTTAT CGACGCCGCC GAGATGTATC CGGTACCGCC GCGCCCGGAA 
ACACAAGGGC TGACGGAGTC CTATATCGGT AACTGGCTCG CCAAACGCGG CAACCGTGAA 
AAACTGATCA TCGCCAGCAA AGTTAGCGGA CCGGCACGTA ATAATGATCA AGGCATCCGG 
CCTCATCAGG CGCTGGATCG TAAAAATATT CGCGAAGCGC TACACGACAG TTTGACCCGA 
TTGCAGACCG ACTATCTGGA TTTGTATCAG GTGCACTGGC CGCAGCGCCC CACTAACTGC 
TTCGGTAAAC TCGGCTATAA CTGGACGGAC TCCACGCCAG TAGTAAGTCT GCTGGAGACG 
TTAGACGCGC TAAGTGAGTT TCAGCGAGCG GGTAAGATTC GTTATATTGG CGTTTCAAAT 
GAGACAGCGT TTGGCGTTAT GCGCTATCTG CATCTGGCGG AAAAACATGA CCTGCCGCGT 
ATTGTCACGA TCCAGAACCC CTATAGCCTG TTAAACCGCA GCTACGAGGT CGGGCTGGCG 
GAAGTCAGCC AGTATGAAGG TGTTGAATTG CTCGCCTATT CCTGTCTGGC GTTTGGCACA 
TTAACCGGTA AATACCTGAA CGGGGCCAAA CCCGCAGGCG CGCGGAATAC CTTGTTCAGC 
CGCTTCACAC GTTACAGCGG CGAACAGGCG CAAAAAGCCG TTGCCGCCTA CGTCGATATC 
GCGAAGCGTC ACAATCTTGA TCCGGCGCAG ATGGCGCTGG CCTTTGTTCG CCGCCAGCCG 
TTTGTCGCCA GTACGTTACT GGGCGCAACC ACGATGGCGC AGCTCAAGAC GAATGTGGAA 
AGTCTGCATC TGACGTTAAG CGAAGAGGTT CTGGCGGAGA TTGAGGCGGC GCATCAGGTT 
TATACCTATC CGGCGCCGTG A

Protein sequence

MHYHRIPHSS LEVSTLGLGT MTFGEQNSEA DAHAQLDYAI ANGINLIDAA EMYPVPPRPE 
TQGLTESYIG NWLAKRGNRE KLIIASKVSG PARNNDQGIR PHQALDRKNI REALHDSLTR 
LQTDYLDLYQ VHWPQRPTNC FGKLGYNWTD STPVVSLLET LDALSEFQRA GKIRYIGVSN 
ETAFGVMRYL HLAEKHDLPR IVTIQNPYSL LNRSYEVGLA EVSQYEGVEL LAYSCLAFGT 
LTGKYLNGAK PAGARNTLFS RFTRYSGEQA QKAVAAYVDI AKRHNLDPAQ MALAFVRRQP 
FVASTLLGAT TMAQLKTNVE SLHLTLSEEV LAEIEAAHQV YTYPAP