Gene Rsph17025_0276 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_0276
Symbol	deoA
ID	5083465
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	+
Start bp	269979
End bp	271286
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	72%
IMG OID	640481831
Product	thymidine phosphorylase
Protein accession	YP_001166491
Protein GI	146276332
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0213] Thymidine phosphorylase
TIGRFAM ID	[TIGR02643] thymidine phosphorylase [TIGR02644] pyrimidine-nucleoside phosphorylase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.57515
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACGCGC GTTCGATCAA CGCCAGGCTG CGCCGCGGCG AGGTGCCCTC GGCGGCCGAA 
CTCGGCTGGT TCGCGCAGGG GCTTGCCTCG GGCCATGTCA CCGACGCGCA GGCCGGCGCC 
TTCGCCATGG CGGTCTGCCT GCAAGGCCTG GGCGAGGAGG GGCGCGTGGC GCTCACCCGC 
GCCATGCGCG ACTCGGGCCG GGTGCTCGAA TGGGACCTGC CGGGGCCGGT GCTCGACAAG 
CACTCGACAG GCGGGATCGG CGACTGCACC TCGCTGCTGC TGGCGCCCGC GCTCGCCGCC 
TGCGGGGCCT ATGTGCCGAT GATCTCGGGC CGGGGGCTCG GCCACACCGG CGGCACGCTG 
GACAAGCTCG AGTCGATCCC GGGCTTTCGG GTCGCTCTTG GGGAGGACCG CCTGCGCGGG 
CAGATCGAGG ATGTGCGCTG CGCCATCGTC GCCGCCGACG AGAGCATGGC CCCGGCGGAC 
CGGCGGCTCT ACCTGATCCG CGACGTGACC GGCACGGTCG AGTCGATCGA CCTCATCACG 
GCGTCCATCC TGTCCAAGAA GCTCGCGGCC GGGCTCGAGG GGCTGGTGCT CGATGTGAAG 
GTGGGGTCGG GTGCCTTCAT GAAGTCGATG GACGAGGCGG AGGCGCTGGC GCGTGCCCTG 
GTGGGCACGG CGCAGGGGGC GGGCTGCATG ACCTCGGCGC TCATCACCGA CATGAGCCAG 
CCGCTCGCCA CCGCGGCGGG CAACGCGCTC GAAGTGATCG AGGTGATGGA GACCCTGACC 
GGAACCTCGA TCAACGCGGC CCTCTGGGAT GTGACGGTGG CGCTGGGCGG CGAGGCGCTG 
GCGCTGGGCG GGCTGGCGGC CGACGCCGAG GATGGCGCGC ACCGGATCGA GCAGGCGCTG 
GAAAGCGGCC ACGCCGCCGA ATATTTCGCC CGCATGGTGG CGGCGCAGGG CGGGCCCGTC 
GATTTCGTCG AGCGATGGCC CGACCGGCTG CCCTCGGCCC CGGTAATGCG CGAGGTGCCC 
AGCCTGCGCA CGGGGTTCGT GCTGCGGATC GACACGGCGG CGCTGGGCCA GGCGGTCGTG 
CGGCTCGGCG GGGGCAGGCT GCGTGAAACC GATCGGGTGA ATCCCTCGGT GGGCCTCGCC 
GACATTGCGG GGATCGGCGA GGAAGTGTCC GAGGACCTGC CGCTCGCGAT GGTCCATGCC 
GCCACCGAAG CGGATGCCGA GGCGGCGATC TCGGCGATTC AGGCGGCCTA TGTGATCTCG 
GATCAGGAGC CGGCCGAACC GCCGCTCATT CATGCGAGGA TCGCCTGA

Protein sequence

MDARSINARL RRGEVPSAAE LGWFAQGLAS GHVTDAQAGA FAMAVCLQGL GEEGRVALTR 
AMRDSGRVLE WDLPGPVLDK HSTGGIGDCT SLLLAPALAA CGAYVPMISG RGLGHTGGTL 
DKLESIPGFR VALGEDRLRG QIEDVRCAIV AADESMAPAD RRLYLIRDVT GTVESIDLIT 
ASILSKKLAA GLEGLVLDVK VGSGAFMKSM DEAEALARAL VGTAQGAGCM TSALITDMSQ 
PLATAAGNAL EVIEVMETLT GTSINAALWD VTVALGGEAL ALGGLAADAE DGAHRIEQAL 
ESGHAAEYFA RMVAAQGGPV DFVERWPDRL PSAPVMREVP SLRTGFVLRI DTAALGQAVV 
RLGGGRLRET DRVNPSVGLA DIAGIGEEVS EDLPLAMVHA ATEADAEAAI SAIQAAYVIS 
DQEPAEPPLI HARIA