Gene Amir_6449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_6449
Symbol	deoA
ID	8330660
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	7550646
End bp	7551920
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	74%
IMG OID	644946877
Product	thymidine phosphorylase
Protein accession	YP_003104096
Protein GI	256380436
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0213] Thymidine phosphorylase
TIGRFAM ID	[TIGR02644] pyrimidine-nucleoside phosphorylase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCCACA CCGCTGTCGA CGTCATCAGG GCGAAGCGCG ACGGGCTCCG GCTCACCGAC 
GGCCAGGTCG ACTGGGTCGT CGACGCCTAC ACCAGGGGCG AGGTCGCCGA CGAGCAGATG 
TCCGCGCTCG CCATGGCGAT CTTCCTCAAC GGCATGGACG CCGCCGAGAC GGCCCGCTGG 
ACCAGGGCCA TGATCGCGTC CGGCGACGTG CTGGACCTGC GGGTCGACCG CCCCACGGTG 
GACAAGCACT CCACCGGCGG CGTGGGCGAC AAGATCACCC TCCCGCTGGC CCCGCTGGTC 
GCCGCGTGCG GCGCGGCGGT GCCGCAGCTG TCCGGGAGGG GCCTCGGGCA CACCGGCGGC 
ACCCTGGACA AGCTGGAGTC CATCCCCGGC TGGCGGGCGC AGCTGTCCCT GGACGAGATC 
ACCGCCCAGC TGGGCTCGGT CGGCGCCGTG GTCTGCGCGG CCACCACCGG CCTGGCCCCG 
GCGGACCGCA AGCTGTACGC CCTGCGGGAC GTCACCGGCA CGGTCGAGGC GATCCCGCTG 
ATCGCCAGCT CGATCATGTC GAAGAAGATC GCCGAGGGCG CGGACGCGCT GGTGCTGGAC 
GTGAAGGTCG GCTCCGGGGC GTTCATGAAG ACCGAGGAGC GGGCGCGTGC GCTCGCGCGG 
GCGCTGGTGG ACATCGGCGT TGACCACGGC CGCAAGGTGA CCGCGCTGCT GACGGACATG 
TCGGTGCCGC TGGGCGCGGC GGTCGGCAAC GCGATCGAGG TCGCCGAGTC GGTGGACGTC 
CTGCGCGGCG GCGGCCCGGA GGACGTGGTC GAGCTGACCG TCGCCCTGGC CCGCGAGATG 
CTGGCGCTGG CGGGGATCGA CGTGGACCCG GCGCGCGTGC TGGCGTCCGG CGAGGCGTAC 
GAGACGTGGG CCCGGATGAT CAGGGCCCAG GGCGGCGACC CCGAGGCGGA GCTGCCGGTC 
GCGAAGCACA CGCGGGTGCT GGAGGCCGCC GAGGACGGCG TGCTGACCGG GCTGGACGCG 
TACGCGGTCG GCGTCGCGGC GTGGCGGCTC GGCGCGGGCC GGGCCCGCAA GGAGGACCCG 
GTGCAGGCCG GGGCCGGGGT GAGGTGCCTG GTGAAGCCGG GTGCGGCGGT GAGCGCGGGA 
CAGCCGATCG CGGAGCTGTA CACGGACACG CCGGAGGCGT TCGACGCGGC GTTCGAGACG 
CTGCGCGGGG GCGTGGAGCT GAACGGGGAG GTCACCGAGC GCTCGGCGCT GGTGATCGAC 
ACGATCCGCG GCTGA

Protein sequence

MSHTAVDVIR AKRDGLRLTD GQVDWVVDAY TRGEVADEQM SALAMAIFLN GMDAAETARW 
TRAMIASGDV LDLRVDRPTV DKHSTGGVGD KITLPLAPLV AACGAAVPQL SGRGLGHTGG 
TLDKLESIPG WRAQLSLDEI TAQLGSVGAV VCAATTGLAP ADRKLYALRD VTGTVEAIPL 
IASSIMSKKI AEGADALVLD VKVGSGAFMK TEERARALAR ALVDIGVDHG RKVTALLTDM 
SVPLGAAVGN AIEVAESVDV LRGGGPEDVV ELTVALAREM LALAGIDVDP ARVLASGEAY 
ETWARMIRAQ GGDPEAELPV AKHTRVLEAA EDGVLTGLDA YAVGVAAWRL GAGRARKEDP 
VQAGAGVRCL VKPGAAVSAG QPIAELYTDT PEAFDAAFET LRGGVELNGE VTERSALVID 
TIRG