Gene Dgeo_2058 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_2058
Symbol
ID	4058404
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008025
Strand	-
Start bp	2165243
End bp	2166292
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	68%
IMG OID	641231097
Product	type I topoisomerase, putative
Protein accession	YP_605521
Protein GI	94986157
COG category	[L] Replication, recombination and repair
COG ID	[COG3569] Topoisomerase IB
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.419584
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.93712
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGGCC GTACCGACCT GCTGCACGAG GAGTACCTGC GCCGCGAGGG GAACAAACCC 
GGTGAGTTCC GCTACTTCTG GCCGGACGGA GAAGAGTACA CCGACCCAGA GGGCCTCGAC 
CGCATTGCCG CGCTTGCGGT GCCGCCCGCC TACACGGAGG TCTACGTCTC GCCCGACCCC 
GACGCAGAAC TCCAGGCGTT TGGCCGCGAT GCCGCCGGAC GCCTCCAGTA CCGCTACCAC 
CCGGACTTCG TGCAGGCGGG CGCGCTGAAG AAGTGGCAAC GGCTGGCGCG GTTTGCTGGG 
GTGCTGCCCA CCCTGCGTGC GGTGACCGCT GCTGACCTGC GCCTCTCCGG TTTGCCGCGC 
CGCAAGGTGC TCGCCGTGAT GTCCCGGCTG CTGCACGTCG CACATTTCCG GGTGGGCAGC 
GACGCCTATG CCCGCGCGCA TAGAACCTAC GGCCTCTCCA CCCTGCGGCA GCGGCACGTC 
AGGGTGAGCG GACAGGACAT CACCTTCCGC TTCAAGGGCA AGCATGCCAT CCTGCAGGAG 
AAGACGGTCC GTAACCGCAC GCTGGCGACC AACATCGAGC GGCTGCTGGA GCTGCCCGGC 
CCTTGGCTGT TCCAGAGCGT GGACGAAGGC GAGCGGACCC GTGTCCGCGC CCCTGACCTG 
AACGCCTCCC TGCGCGAGGT GATCGGCCCC TTTACGGCCA AGGATTTCCG GACCTGGGGC 
GGTACGCTGC TCGCTGCCGA ATTTCTGGCG GAGGCGGGAC CGCCCGAAAC GGAGCGCCAG 
GCCCGCAAGA CCATCGTGGA ATGCGTGAAG TTTGTCGCCG CTGACCTCGG CAACACGCCC 
GCCGTCACGC GCGGCAGCTA CATCTGCCCC GTCATCTTCG ACCGCTATCA GGCGGGCAAG 
GTGCTCGACG ACTACGAACC CCGCGCGGGC CGCCCCGAAC CGGAACTGGA GGGCCTCACC 
CGCAGCGAGG CCGCGCTGAA GCGGATGCTG GAGAGTGAAC AGGCACTGCG GACGCGCCAA 
AGCAGGAAGA AGGCAAAAGA GGCCGCCTGA

Protein sequence

MAGRTDLLHE EYLRREGNKP GEFRYFWPDG EEYTDPEGLD RIAALAVPPA YTEVYVSPDP 
DAELQAFGRD AAGRLQYRYH PDFVQAGALK KWQRLARFAG VLPTLRAVTA ADLRLSGLPR 
RKVLAVMSRL LHVAHFRVGS DAYARAHRTY GLSTLRQRHV RVSGQDITFR FKGKHAILQE 
KTVRNRTLAT NIERLLELPG PWLFQSVDEG ERTRVRAPDL NASLREVIGP FTAKDFRTWG 
GTLLAAEFLA EAGPPETERQ ARKTIVECVK FVAADLGNTP AVTRGSYICP VIFDRYQAGK 
VLDDYEPRAG RPEPELEGLT RSEAALKRML ESEQALRTRQ SRKKAKEAA