Gene Dgeo_0019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_0019
Symbol
ID	4058734
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008025
Strand	+
Start bp	18407
End bp	19438
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	73%
IMG OID	641229016
Product	A/G-specific adenine glycosylase
Protein accession	YP_603492
Protein GI	94984128
COG category	[L] Replication, recombination and repair
COG ID	[COG1194] A/G-specific DNA glycosylase
TIGRFAM ID	[TIGR01084] A/G-specific adenine glycosylase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTCGACC TTCCCCTTTC CTCCCTGCGC ACTGTGCTGC TGGCCTGGTT CGACCGCGCC 
GGGCGTGCGC TTCCCTGGCG GGTGGGACCG GAGGGCAGGC GCGATCCCTA CCGCGTGTGG 
GTATCGGAGG TGCTGCTCCA GCAGACGCAA GTCGCACGGG GCCGGGTGTA CTTTGAGCGG 
TTTCTGGAAG CCTTTCCCAC CGTAGAGGCG CTGGCCGACG CCCCCATCGA GGCGGTGCTT 
AAGGCGTGGG AGGGCTGCGG CTACTACGCG CGGGCACGGA ATCTGCACCG GGCAGCGGGC 
GTGATGGCGC GCGAGGGCGT GCCGACGACC TACGACGGCT GGCGTGCCCT GCCGGGCGTC 
GGACCGTACA CGGCGGCGGC GGTCGCGAGC CTGGCGTGTG GGGAGGCGCG GGCGGTGAAC 
GATGGGAACG TGCGCCGGGT GCTCGCGCGG TTGCACGGCG AGCGGCAGCC CACCGCAGCC 
TGGGCGCAGG CACGGGCGGA CGAACTGCTT GACCCGGCGA GGCCCGGCGC CTGCAACGAG 
GCGTTGATGG ACCTGGGCGC GACGGTCTGC ACGCCGAAAG CGCCGCAGTG CGGCGAGTGC 
CCGCTGCGGC GCTGGTGCGC GGCCTTCCAG TTGGGCGATC CCGCCGCCTT CCCGGCGCCG 
AAAGTCCGGG CAGCGGTGCG CGAGGTGCGG GCGGTGGCCC TGCTGCTGGG CGACGCCCAG 
GAGGCCGTCC TGGAACGTCG CGCGGGCTCC TTGCTGGGCG GCCTGATGGG TCTGCCGACC 
GAGATGCTGG AGGCAGGCGA AAGCAAAGTC GACGCGCTGA CCCGGCTGGC GGCCCGGCTC 
GGGGCAACTG TGGCGGGCGA ATTGGGCACC GTCACCCACA GCATGACCCA CCGCCGCGTC 
ACCCTCACCG TCTATGCCGG GGGAGGCGGC CCGGCCCGCT CCCGCGTCAC GGAAGCCGCG 
CTGTCCCGAC TGGACCACAA GGCGCTGGCG CTGTGGGAGA GGCAGCAGAC GTCGCTGTTC 
TCCCCGGCTT GA

Protein sequence

MVDLPLSSLR TVLLAWFDRA GRALPWRVGP EGRRDPYRVW VSEVLLQQTQ VARGRVYFER 
FLEAFPTVEA LADAPIEAVL KAWEGCGYYA RARNLHRAAG VMAREGVPTT YDGWRALPGV 
GPYTAAAVAS LACGEARAVN DGNVRRVLAR LHGERQPTAA WAQARADELL DPARPGACNE 
ALMDLGATVC TPKAPQCGEC PLRRWCAAFQ LGDPAAFPAP KVRAAVREVR AVALLLGDAQ 
EAVLERRAGS LLGGLMGLPT EMLEAGESKV DALTRLAARL GATVAGELGT VTHSMTHRRV 
TLTVYAGGGG PARSRVTEAA LSRLDHKALA LWERQQTSLF SPA