Gene SNSL254_A3236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3236
Symbol	tas
ID	6482729
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	3149888
End bp	3150928
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	55%
IMG OID	642738536
Product	putative aldo-keto reductase
Protein accession	YP_002042258
Protein GI	194443055
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0896684
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.000000643826
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCACTATC ACCGTATACC CCACAGCTCG CTCGAAGTAA GTACGCTAGG GCTGGGCACA 
ATGACATTTG GTGAACAAAA CAGCGAAGCC GACGCTCACG CACAGCTCGA CTATGCCATC 
GCAAATGGCA TTAACCTTAT CGATGCCGCC GAGATGTATC CGGTACCGCC GCGCCCGGAA 
ACACAAGGGC TGACGGAGTC CTATATCGGT AACTGGCTCG CCAAACGCGG CAACCGTGAA 
AAACTGATCA TCGCCAGCAA AGTTAGCGGA CCGGCACGTA ATAATGATCA AGGCATCCGG 
CCTCATCAGG CGCTGGATCG TAAAAATATT CGCGAAGCGC TACACGACAG TTTGACCCGA 
TTGCAGACCG ACTATCTGGA TTTGTATCAG GTGCACTGGC CGCAGCGCCC CACTAACTGC 
TTCGGTAAAC TCGGCTATAA CTGGACGGAC TCCACGCCAG TAGTAAGTCT ACTGGAGACG 
CTAGACGCGC TAAGTGAGTT TCAGCGAGCG GGTAAGATTC GTTATATTGG CGTTTCAAAT 
GAGACAGCGT TTGGCGTTAT GCGCTATCTG CATCTGGCGG AAAAACATGA CCTGCCGCGT 
ATTGTCACGA TCCAGAACCC CTATAGCCTG TTAAACCGCA GCTACGAGGT CGGGCTGGCG 
GAAGTCAGCC AGTATGAAGG TGTTGAATTG CTCGCCTACT CCTGTCTGGC GTTTGGCACA 
TTAACCGGTA AATACCTGAA CGGGGCCAAA CCCGCAGGCG CGCGGAATAC CTTGTTCAGC 
CGCTTCACAC GTTACAGCGG CGAACAGGCG CAAAAAGCCG TTGCCGCCTA CGTCGATATC 
GCGAAGCGTC ACAATCTTGA TCCGGCGCAG ATGGCGCTGG CCTTTGTTCG CCGCCAGCCG 
TTTGTCGCCA GTACGTTACT GGGCGCAACC ACGATGGCGC AGCTCAAGAC GAATGTGGAA 
AGTCTGCATC TGACGTTAAG CGAAGAGGTT CTGGCGGAGA TTGAGGCGGC GCATCAGGTT 
TATACCTATC CGGCGCCGTG A

Protein sequence

MHYHRIPHSS LEVSTLGLGT MTFGEQNSEA DAHAQLDYAI ANGINLIDAA EMYPVPPRPE 
TQGLTESYIG NWLAKRGNRE KLIIASKVSG PARNNDQGIR PHQALDRKNI REALHDSLTR 
LQTDYLDLYQ VHWPQRPTNC FGKLGYNWTD STPVVSLLET LDALSEFQRA GKIRYIGVSN 
ETAFGVMRYL HLAEKHDLPR IVTIQNPYSL LNRSYEVGLA EVSQYEGVEL LAYSCLAFGT 
LTGKYLNGAK PAGARNTLFS RFTRYSGEQA QKAVAAYVDI AKRHNLDPAQ MALAFVRRQP 
FVASTLLGAT TMAQLKTNVE SLHLTLSEEV LAEIEAAHQV YTYPAP