Gene Dred_1101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dred_1101
Symbol
ID	4956968
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum reducens MI-1
Kingdom	Bacteria
Replicon accession	NC_009253
Strand	+
Start bp	1172197
End bp	1173513
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	48%
IMG OID	640180271
Product	pyrimidine-nucleoside phosphorylase
Protein accession	YP_001112461
Protein GI	134298965
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0213] Thymidine phosphorylase
TIGRFAM ID	[TIGR02644] pyrimidine-nucleoside phosphorylase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGAATGG TGGACATTAT CCTGAAAAAA AGACGGGGCT TGGAACTTAC CTCGGAAGAA 
ATAGAATTTT TTATTCAGGG TTATACCAAG GGAGAAGTAC CGGACTATCA AGCGGCAGCC 
TTTCTAATGG CAGCCTTTTT CCAGGGACTA ACCCCCAGGG AAACGGGAGA TTTAACTATG 
TCCATGGCTA GATCCGGTGA TCAGGCGGAC CTTTCATCGA TTCCCGGCAT AAAGGTCGAT 
AAGCATAGTA CAGGTGGCGT TGGGGATAAA GTTACGTTAA TTCTCGGACC CTTGGTTGCG 
GCTGCGGGCA TACCGGTGGC TAAGATGTCC GGTCGGGGCT TGGGACATAC CGGAGGCACC 
ATTGATAAAC TGGAATCCAT TCCAGGCTTC CAAGTAACCA TGGATAACCA AAATTTTTTG 
CAACAGGTAA AACGAGTAAA ATTGGCCGTT GTGGCCCAAA CCGGTCATTT AGCTCCGGCA 
GATAAGAAAC TCTATGCATT ACGGGATGTT ACGGCCACTG TGGACAGTAT TCCCTTTATT 
GCTGCCTCGG TCATGAGTAA AAAGATAGCC GCCGGGGCGG ATGCCATCGT ATTGGATGTT 
AAGGTGGGCA GTGGTGCATT CATGAAAAAC TCAGAGGATG CCTTTTCCTT AGCCAGAACT 
ATGGTGGAAA TTGGCACCAG CGTAGGGCGG CAAACGGTGG CCCTGGTTAC CGACATGGAT 
CAACCCTTGG GTTTTGCCAT TGGCAATGCG TTGGAGGTAA AAGAAGCCAT CGAAACCCTA 
AGGGGCAACG GGCCGGCTGA TTTACGGGAG CTATGCATTT ATCTGGGCAC CGAGATGCTA 
AAACTGGCTG GCATAGCAGA GGATGAGTTA GTAGCCCGCA GAAAATTAGA AGAGCTCTTA 
AGTAATGGTG GCGCCCTCAA TAAATTTAAG GAGCTTATTG AGGCCCAGGG CGGTGATCCT 
GAAGTTGTGG AGAATCCCGA TCGATTACCG GGGGCCTCTA GTGTATATCC TGTGATATCA 
GATATAGAGG GATATGTAAG GGAAATACAG TCTGAGCAGG TTGGCGTCGT TGCCATGTGG 
CTGGGGGCTG GCAGGGCCAC TAAGGAATCG GTGATCGACC TAGGTGTGGG TGTGGTCTTA 
AAGAAAAAGG TCGGTGATTA TGTAAAGAAA GGTGAGGTTA TCGCTGATTT ACATGTTAAT 
GAAAACAAGG AAATTGCCAA GGTTGCAGAC CTGCTAAGGA AGGCCTATGT TTTACAAAGG 
GAACCAGTCG TGGCCAAGGA AATTTTACTG GGTAAGGTAA CGAAGGAAAG TATATAA

Protein sequence

MRMVDIILKK RRGLELTSEE IEFFIQGYTK GEVPDYQAAA FLMAAFFQGL TPRETGDLTM 
SMARSGDQAD LSSIPGIKVD KHSTGGVGDK VTLILGPLVA AAGIPVAKMS GRGLGHTGGT 
IDKLESIPGF QVTMDNQNFL QQVKRVKLAV VAQTGHLAPA DKKLYALRDV TATVDSIPFI 
AASVMSKKIA AGADAIVLDV KVGSGAFMKN SEDAFSLART MVEIGTSVGR QTVALVTDMD 
QPLGFAIGNA LEVKEAIETL RGNGPADLRE LCIYLGTEML KLAGIAEDEL VARRKLEELL 
SNGGALNKFK ELIEAQGGDP EVVENPDRLP GASSVYPVIS DIEGYVREIQ SEQVGVVAMW 
LGAGRATKES VIDLGVGVVL KKKVGDYVKK GEVIADLHVN ENKEIAKVAD LLRKAYVLQR 
EPVVAKEILL GKVTKESI