Gene Rsph17029_0248 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_0248
Symbol	deoA
ID	4897868
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	269909
End bp	271216
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	71%
IMG OID	640110831
Product	thymidine phosphorylase
Protein accession	YP_001042139
Protein GI	126461025
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0213] Thymidine phosphorylase
TIGRFAM ID	[TIGR02643] thymidine phosphorylase [TIGR02644] pyrimidine-nucleoside phosphorylase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.363539
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACGCGC GATCGATCAA CGCAAAGCTG CGCCGGGGCG AAGTGCCCTC GGCCGCTGAA 
CTGGGCTGGT TCGCGGAAGG TCTGGCCTCG GGCCATGTCA CCGATGCGCA GGCCGGCGCC 
TTCGCCATGG CGGTCTGCCT GCAGGGGCTG GGCGAGGAGG GGCGTGTGGC CCTGACGCGC 
GCCATGCGCG ACTCCGGCCG TGTGCTCGCC TGGGATCTGC CGGGGCCGGT GCTCGACAAA 
CATTCGACGG GCGGCATCGG CGACTGCACC TCGCTGCTCC TCGCGCCGGC TCTGGCTGCC 
TGCGGGGCCT ATGTGCCGAT GATCTCGGGT CGGGGCCTCG GCCATACGGG GGGCACGCTC 
GACAAGCTGG AAGCGATCCC GGGCTTCCGC GTGGCCCTGG GCGAAGAGCG GCTGCGCGCG 
CAGATCGAGG ATGTCCGCTG CGCCATCGTC GCCGCCGACG AGGGCATGGC GCCCGCGGAC 
CGGCGGCTCT ACCTCATCCG CGACGTGACC GGCACGGTCG AATCGATCGA CCTCATCACC 
GCGTCGATCC TGTCGAAGAA GCTGGCGGCC GGCCTCGAGG GGCTGGTGCT CGATGTGAAA 
GTGGGCTCGG GCGCCTTCAT GAAGTCGATG GACGAGGCCG AAGCGCTGGC GCGTGCTCTG 
GTGGGCACGG CGCAGGGGGC GGGCTGCATG ACATCGGCCC TCATCACCGA CATGAGCCAG 
CCGCTCGCGA CCGCGGCCGG CAATGCGCTC GAGGTGATCG AGGTGATGGA GACGCTGACC 
GGCACCTCGA TCAACGCGGC ACTCTGGGAC GTGACGGTGG CGCTCGGCGG TGAGGCTCTG 
GCGCTGGGCG GGCTTGCCGC CGACGCCGAG GACGGGGCGC ACCGGATCGA GCAGGCGCTG 
GAAAGCGGGC ACGCGGCCGA GTTCTTCGCC CGCATGGTGG CGGCGCAGGG CGGGCCGGTC 
GATTTCGTCG AACGCTGGCC CGACCGGCTG CCCTCGGCCC CGGTGATGCG CGAGGTGCCG 
AGCCTGCGCA CGGGCTTCGT GCTGCGCATC GACACGGCGG CGCTCGGTCA GGCGGTGGTG 
CATCTGGGCG GCGGGCGGCT GCGCGAGACC GACCGGGTGA ATCCCTCGGT GGGTCTGGCT 
GATATCGCCG GGATCGGCGA AGAAGTGTCC GAGGATCTGC CGCTCGCCAT GATCCATGCC 
GCGACCGAGG CCGATGCCGA TGCTGCGGTG GCCGCGATTC AGGCGGCCTA TGTGATCTCG 
GATCAGGAGC CGGCCGAACC GCCGCTCATC CATGCGAGGA TCGCCTGA

Protein sequence

MDARSINAKL RRGEVPSAAE LGWFAEGLAS GHVTDAQAGA FAMAVCLQGL GEEGRVALTR 
AMRDSGRVLA WDLPGPVLDK HSTGGIGDCT SLLLAPALAA CGAYVPMISG RGLGHTGGTL 
DKLEAIPGFR VALGEERLRA QIEDVRCAIV AADEGMAPAD RRLYLIRDVT GTVESIDLIT 
ASILSKKLAA GLEGLVLDVK VGSGAFMKSM DEAEALARAL VGTAQGAGCM TSALITDMSQ 
PLATAAGNAL EVIEVMETLT GTSINAALWD VTVALGGEAL ALGGLAADAE DGAHRIEQAL 
ESGHAAEFFA RMVAAQGGPV DFVERWPDRL PSAPVMREVP SLRTGFVLRI DTAALGQAVV 
HLGGGRLRET DRVNPSVGLA DIAGIGEEVS EDLPLAMIHA ATEADADAAV AAIQAAYVIS 
DQEPAEPPLI HARIA