Gene Sama_0974 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_0974
Symbol	deoA
ID	4603226
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	+
Start bp	1177666
End bp	1178997
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	56%
IMG OID	639780313
Product	thymidine phosphorylase
Protein accession	YP_926851
Protein GI	119774111
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0213] Thymidine phosphorylase
TIGRFAM ID	[TIGR02643] thymidine phosphorylase [TIGR02644] pyrimidine-nucleoside phosphorylase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.290566
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00118059
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTTCTGG CACAAGAGAT TATTCGCAAA AAACGCAACG CAGAGGCCCT CAGCAAAGAA 
GAAATTCAAT TCTTTGTGAA GGGGATTACC GACAACAGCG TATCCGAAGG ACAGATTGCC 
GCGCTGGGTA TGGCGGTATA TTTCAATGAC ATGACCATGG ACGAGCGTAT TGCGCTGACC 
ACGGCCATGC GCGATTCAGG TACCGTGCTC AACTGGGATA GCCTGGGGTT GAACGGCCCT 
GTTATTGATA AGCACAGCAC AGGCGGTGTG GGCGATGTGA TTTCGCTGAT GCTCGGCCCC 
ATGGCCGCAG CCTGTGGTGG TTATGTGCCC ATGATTTCGG GCCGGGGGCT GGGTCATACC 
GGTGGCACAC TGGATAAGTT TGACGCCATT CCCGGTTACC AAACCGAGCC CTCCAGCGAG 
CTGTTCCGCA AAGTGGTAAA AGAAGCCGGT GTTGCCATTA TTGGCCAAAC CGGGGATCTG 
GTGCCCGCCG ACAAGCGTTT CTATTCCATT CGAGACAACA CCGCCACAGT TGAGTCCATT 
TCACTTATCA CCGCATCGAT TCTGTCCAAG AAGCTGGCCG CAGGCCTGGA TGCGCTGGCA 
ATGGACGTCA AGGTAGGCAG CGGCGCCTTT ATGCCGACCT ACGAAGCCTC GTTGGAACTC 
GCGCGCTCCA TTACCGCCGT GGCTAACGGC GCCGGCACCA AAACCACAGC GCTGCTCACC 
GACATGAATC AGGTGTTGGC TTCCTGCGCC GGTAACGCGC TGGAAGTGAA AGAAGCCGTG 
GATTTCCTGA CCGGAAAATA CCGTAATCCT CGCCTTTACG AAGTCACCAT GGGCCTGTGC 
GCCGAGATGC TGGTGCTGGG TGGTCTGGCC GCCAATGACG CCGATGCCCG TACCAAGCTC 
AACACAGTGC TGGATAACGG CCGTGCTGCC GAGATTTTTG GCAAGATGGT GTCCGGCCTG 
GGCGGCCCTG CTGATTTCGT TGAAAGTTAC GATAAGTATC TGCCCAAGGC ATCCATAATA 
CGCCCCGTGT ACGCAGAACG TGACGGCTTT GCCTATAGTA TGGTGACCCG TGAGCTGGGT 
CTTGCCGTGG TCACTCTGGG TGGTGGCCGT CGCAAGCCCG GTGATGCACT GGATTACAGT 
GTAGGCTTGT CCAACGTGTG TGCCCTTGGT CAGCCAATAA ACAAAGACAC GCCGCTTGCC 
GTAATCCATG CCCAGTCTGA GGCCGCTTTT GAAGAAGCCG CCAGGGCCGT TCGTGGGGCT 
ATCACTGTCA GCGACAAGCA ACCCGAAAAA ACACCTGAGA TCTATCAGTA CGTACGTGCT 
GAAGATCTGT AA

Protein sequence

MFLAQEIIRK KRNAEALSKE EIQFFVKGIT DNSVSEGQIA ALGMAVYFND MTMDERIALT 
TAMRDSGTVL NWDSLGLNGP VIDKHSTGGV GDVISLMLGP MAAACGGYVP MISGRGLGHT 
GGTLDKFDAI PGYQTEPSSE LFRKVVKEAG VAIIGQTGDL VPADKRFYSI RDNTATVESI 
SLITASILSK KLAAGLDALA MDVKVGSGAF MPTYEASLEL ARSITAVANG AGTKTTALLT 
DMNQVLASCA GNALEVKEAV DFLTGKYRNP RLYEVTMGLC AEMLVLGGLA ANDADARTKL 
NTVLDNGRAA EIFGKMVSGL GGPADFVESY DKYLPKASII RPVYAERDGF AYSMVTRELG 
LAVVTLGGGR RKPGDALDYS VGLSNVCALG QPINKDTPLA VIHAQSEAAF EEAARAVRGA 
ITVSDKQPEK TPEIYQYVRA EDL