Gene SNSL254_A4924 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A4924
Symbol	deoA
ID	6482244
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	4792543
End bp	4793865
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	56%
IMG OID	642740135
Product	thymidine phosphorylase
Protein accession	YP_002043809
Protein GI	194443952
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0213] Thymidine phosphorylase
TIGRFAM ID	[TIGR02643] thymidine phosphorylase [TIGR02644] pyrimidine-nucleoside phosphorylase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.118094
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	92
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTTCTCG CACAAGAAAT TATTCGTAAA AAGCGTGATG GTCATGCGTT GAGTGACGAA 
GAAATTCGTT TCTTTATCAA TGGTATTCGT GACAATACTA TCTCTGAAGG GCAGATTGCC 
GCCCTGGCGA TGACCATCTT CTTCCACGAT ATGACCATGC CGGAGCGTGT TTCGCTGACC 
ATGGCGATGC GGGATTCCGG TACTGTCCTT GACTGGAAAA GCCTGAATCT CAATGGCCCG 
ATTGTCGATA AGCATTCGAC CGGCGGCGTA GGGGACGTGA CGTCTCTGAT GTTGGGGCCA 
ATGGTAGCGG CCTGCGGCGG TTATGTGCCG ATGATCTCCG GTCGCGGCCT CGGACATACC 
GGCGGTACGC TCGACAAACT GGAAGCGATC CCGGGCTTCG ATATCTTCCC GGACGACAAC 
CGTTTCCGCG AAATTATTCA AGACGTGGGT GTGGCGATTA TTGGGCAAAC CAGCTCGCTT 
GCACCGGCGG ACAAACGTTT TTACGCCACC CGCGATATTA CCGCGACGGT GGACTCTATT 
CCGCTGATCA CCGGCTCCAT CCTCGCCAAG AAACTGGCCG AAGGGCTGGA TGCGCTGGTA 
ATGGACGTCA AAGTCGGCAG CGGCGCGTTT ATGCCAACCT ATGAACTTTC TGAAGCCCTT 
GCTGAAGCGA TTGTCGGCGT GGCAAACGGC GCGGGAGTTC GCACTACGGC GTTGTTAACC 
GATATGAACC AGGTGCTGGC TTCAAGCGCC GGTAACGCGG TGGAAGTGCG TGAAGCCGTG 
CAGTTCCTGA CCGGTGAATA CCGCAATCCG CGCTTGTTTG ACGTCACTAT GGCGCTATGC 
GTGGAGATGC TGATCTCCGG CCAGCTGGCG AAAGACGACG CCGAAGCGCG TGCCAAACTG 
CAGGCGGTGC TGGATAACGG TAAAGCGGCA GAAGTCTTTG GTCGTATGGT GGCCGCGCAG 
AAAGGGCCAA GCGATTTCGT TGAGAACTAC GATAAATACC TGCCGACCGC CATGTTGAGC 
AAAGCGGTAT ATGCTGATAC CGAAGGGTTT ATCAGCGCAA TGGATACGCG TGCGCTGGGG 
ATGGCGGTCG TCTCGATGGG CGGCGGCCGT CGTCAGGCGT CAGATACCAT TGATTACAGC 
GTTGGCTTTA CCGACATGGC CCGTCTGGGC GACAGCATCG ACGGGCAGCG CCCGCTGGCG 
GTGATTCATG CCAAAGACGA AGCCAGTTGG CAGGAAGCGG CGAAGGCCGT CAAAGCGGCA 
ATTATCCTTG ACGATAAAGC GCCAGCAAGC ACACCTTCGG TCTATCGTCG AATTACTGAA 
TAG

Protein sequence

MFLAQEIIRK KRDGHALSDE EIRFFINGIR DNTISEGQIA ALAMTIFFHD MTMPERVSLT 
MAMRDSGTVL DWKSLNLNGP IVDKHSTGGV GDVTSLMLGP MVAACGGYVP MISGRGLGHT 
GGTLDKLEAI PGFDIFPDDN RFREIIQDVG VAIIGQTSSL APADKRFYAT RDITATVDSI 
PLITGSILAK KLAEGLDALV MDVKVGSGAF MPTYELSEAL AEAIVGVANG AGVRTTALLT 
DMNQVLASSA GNAVEVREAV QFLTGEYRNP RLFDVTMALC VEMLISGQLA KDDAEARAKL 
QAVLDNGKAA EVFGRMVAAQ KGPSDFVENY DKYLPTAMLS KAVYADTEGF ISAMDTRALG 
MAVVSMGGGR RQASDTIDYS VGFTDMARLG DSIDGQRPLA VIHAKDEASW QEAAKAVKAA 
IILDDKAPAS TPSVYRRITE