Gene RSc0204 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSc0204
Symbol	deoA
ID	1219007
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ralstonia solanacearum GMI1000
Kingdom	Bacteria
Replicon accession	NC_003295
Strand	+
Start bp	225922
End bp	227445
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	63%
IMG OID	637236561
Product	thymidine phosphorylase
Protein accession	NP_518325
Protein GI	17544923
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0213] Thymidine phosphorylase
TIGRFAM ID	[TIGR02645] putative thymidine phosphorylase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.61192
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGCTC CGCCTGAGGT GGCAGCACTG CCCGATCGGC TTACCTTCAA GCCGTTGGGC 
ATCGACACTT GGCAGGAGCA CGTCATCTAC ATGCATCCGG ATTGCGCAAT CTGCCGGGCT 
GAGGGGTTCA CTGCACAAGC TCGGGTGGAG GTGCGGATCG GTCTGCGCTC CTTGATTGCC 
ACACTCAATC TCGTCGGCTC AGGCTTGCTG GAGATGTGTG AGGTCAGCTT GTCCGTCAGC 
GCCGTCGAGA CGCTGATGGC GAGGCCCGGC GATATTGTGA CTGTCAGTCA CGCGCCCGCG 
CTGGAGTCGC TGCGGGCGGT ACGCGCCAAG ATCTATGGGG CGCATCTGGA TACGCATCAA 
CTGGCTAGCG TCGTCGGTGA TATTGCCAAA GAGCGGTATG CCGACGTCCA CATTGCGGCG 
TTCCTGAGCG CCTGCGCAGG CGGGCGAATG AGCGTCAAGG AGACAATCGA TCTCACCCAG 
GCCATGGTCG ACTCGGGCGA ATGTCTCGAA TGGGATCGCG AGATCGTCGC GGACAAGCAC 
TGTGTGGGCG GCTTGCCGGG CAACCGTACC AGTCCCATCG TGGTCGCCAT CGCTGCCGCT 
GCAGGCTTGT TGCTACCTAA GACCTCGTCG CGCGCCATCA CGTCACCCGC CGGTACCGCC 
GACACGATGG AGACACTCAC GCGTGTTGCT CTGAGCGCCA CGGAGTTGCG ACGCGTCGTT 
GATCGGGTTG GAGCTTCGCT CGCGTGGGGC GGTGCGCTCA GCCTTAGCCC CGCCGACGAC 
GTGCTCATTC GCGTGGAGCG GGCGTTGGAT GTGGATAGCG ATGCCCAACT TGCGGCCTCC 
ATTCTGTCGA AGAAGATCGC GGCCGGGTCA ACCCATGTCT TGATCGACGT GCCCGTGGGG 
CCGACGGCCA AGGTGCGCAG TCTGCAGGAT TTGGAGCGCC TGCGTATGCT GCTCGAGCGC 
GTAGCGCGGT CGTTCGGCGT GCGCGTCACG ATCGTGCGCA CGGACGGCTC GCAGCCGGTT 
GGCAGGGGAA TTGGTCCGGC GCTTGAAGCA CGAGACGTCT TGGCCGTGCT TCAACGCTCT 
CCTGCGGCGC CGTTCGACCT GCGGGAGCGG TCGTTGTTGC TGGCTGCGAC TCTGCTAGAG 
TTTTGTGGGG CGGTGGAGCA GGGGGCAGGG CTTGAGATGG CCACAGGCGT GCTGGACAGT 
GGTGCGGCGT GGCGGAAGTT CGAGGAAATC TGCGAAGCGC AGGGAGGCCT GCGTGTGCCA 
GGTGAGGCCA TCTTCCGTCG TGATGTGGTA GCTGAGCAAG ACGGCATCGT CACCGAGATC 
GACAACCGAC ATCTTGCTCG TATCGCGAAA CTCGCGGGGG CTCCGATGCG CCAAGTGGCA 
GGCGTGGAGA TGCACGTGAG ACTACACGAC CAGGTTAAGG CGGGGCGGCC TCTCTTTACC 
ATCCATGCCC AGGCTTCAGG TGAACTGGAA TATTCCGTAG CTTATGCACT GATGCACCCA 
GCGGTTTCCA TCGCCCCGAC TTGA

Protein sequence

MLAPPEVAAL PDRLTFKPLG IDTWQEHVIY MHPDCAICRA EGFTAQARVE VRIGLRSLIA 
TLNLVGSGLL EMCEVSLSVS AVETLMARPG DIVTVSHAPA LESLRAVRAK IYGAHLDTHQ 
LASVVGDIAK ERYADVHIAA FLSACAGGRM SVKETIDLTQ AMVDSGECLE WDREIVADKH 
CVGGLPGNRT SPIVVAIAAA AGLLLPKTSS RAITSPAGTA DTMETLTRVA LSATELRRVV 
DRVGASLAWG GALSLSPADD VLIRVERALD VDSDAQLAAS ILSKKIAAGS THVLIDVPVG 
PTAKVRSLQD LERLRMLLER VARSFGVRVT IVRTDGSQPV GRGIGPALEA RDVLAVLQRS 
PAAPFDLRER SLLLAATLLE FCGAVEQGAG LEMATGVLDS GAAWRKFEEI CEAQGGLRVP 
GEAIFRRDVV AEQDGIVTEI DNRHLARIAK LAGAPMRQVA GVEMHVRLHD QVKAGRPLFT 
IHAQASGELE YSVAYALMHP AVSIAPT