Gene Dgeo_1722 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_1722
Symbol
ID	4058342
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008025
Strand	+
Start bp	1829341
End bp	1830957
Gene Length	1617 bp
Protein Length	538 aa
Translation table	11
GC content	67%
IMG OID	641230745
Product	Dak phosphatase
Protein accession	YP_605186
Protein GI	94985822
COG category	[R] General function prediction only
COG ID	[COG1461] Predicted kinase related to dihydroxyacetone kinase
TIGRFAM ID	[TIGR03599] DAK2 domain fusion protein YloV

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0961708
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0612757
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCTGAGC AGGTCACCGC GCTTAAACCC GCCGACCTCG CCCATATGCT GCGTGTGGCA 
ACTGACTGGC TGGGCGTGTA CCGCGAACAG GTGAACGCGC TGAACGTGTA CCCGGTTCCC 
GACGGCGACA CTGGCACGAA CATGCACCTG ACCATGCAGT CGGTGCGGCG CGAGCTCGAT 
ACCTGCGATG AAAACAGCAT GGCGTCGGTG GCGCGGGCCA TCAGCTACGG GGCACTGCTG 
GGGGCGCGCG GCAACAGCGG CGTGATTCTC TCGCAGCTCC TCAAAGGCTT TGCCGAGGCC 
ATCCGCGACC GCGTGGAGGT GGACGCCAGC GCCCTCGCCG CCGCCTTCCG CGCTGCCCAA 
AAGGCCGGAT ACGGCGCCGT GATGAAGCCG GTGGAGGGCA CCATTCTGAC GGTCGCCCGC 
GGGGTGGCCG ATGGCGCGAA CGGCCCACGC GAGCGCGACA CGGTAGACGC CGTGCTTGAG 
CAGGCGCTCT TTGGCGGCCA GGCGCTGCTG GATCAGACGC CCGAGATGCT CCCCGCGCTC 
AAGCAGGCGG GCGTGATCGA CTCCGGCGGG CAGGGGTACC TGTATGTGGT GCAGGGGATG 
TTGGCGGCTC TGCGCCATGA GGCCCTCCCC GAGGCGCCCC AGATCACCGC CTACGCGCAG 
GAGCAGTTCG AGAACGAGGA ATTCGGCTAC TGCACCGAGT TCCTGATGAC GGACGCCAGC 
AAGCCCATCG AGGAGATCCG CGAGCTGGTC AGTCCCTTCG GGGACAGCCT GCTGGTGGTC 
GGCGCCGAGG GGTACGTGAA GGGCCACATC CACACCAACG AACCCGACGC GCTGCTGGCA 
ACCGTGGGCC GCTATGGTCG GATGCTCAAG ACCAAGGTTG AAGATATGTC CGAGCAGCAC 
ACCGAGATCC TGGGCATGGC AGGCGCGGCG GCACGGGCCG AGGAGGAGAT CCCGCCCTCC 
GGCCTGGTCG CGGTCGCAAA CGGCTACGGC CTGGTCAAGC TCTTCCGTTC TCTCGGCGCG 
CGCATCGTGT CGGGTGGGCA GACCGCCAAC CCCAGCGTGC AGGACATCGT GGACGCGGTG 
CGCTCGGTGA GTGCCGAGAA GGTGCTGATC CTGCCCAACA ACAAGAATGT GCTGATGGCT 
GCCGAAAAGG CGACCGAGCT GCTGGAGGGC CGCGCGGTGA TCGTGCCTAC CCGCACGCTC 
GGACAGGGCA TCGGAGCGGC GCTGGCCTTC CAGCCCGACG CTGACGCCGA GCGTCTGAAG 
GCCGAGATGG CGGAGGCCGC CGCCCGCGTG ACCACCTTCG AGGTCACCCG CGCGAGCCGC 
ACAACCAACA TCACGACCAA AGACGGCGTC ACTCTGGACA TTGCCGAGGG CGATGTGATC 
GGCCTCAAGG ACGACGAGCT GGTGCAGGCG GGCGGCACAC CCGAGGACAG TGTGCTGGAG 
ATGCTGAACC GAAACTACGC CGGGCAGGAG ATCATCACGG TGTTCGGCGG GCCGCAGAAG 
ACCCAGGAGG ATCTGGACGC CCTCGCCGCG CGCATCGGAC AGGAGTTCCC GATGGCCGAG 
GTCGAGGCGC ATCTGGGTGG CCCGGATCTG TACGACTATC TGGTGACGCT CGAGTAA

Protein sequence

MPEQVTALKP ADLAHMLRVA TDWLGVYREQ VNALNVYPVP DGDTGTNMHL TMQSVRRELD 
TCDENSMASV ARAISYGALL GARGNSGVIL SQLLKGFAEA IRDRVEVDAS ALAAAFRAAQ 
KAGYGAVMKP VEGTILTVAR GVADGANGPR ERDTVDAVLE QALFGGQALL DQTPEMLPAL 
KQAGVIDSGG QGYLYVVQGM LAALRHEALP EAPQITAYAQ EQFENEEFGY CTEFLMTDAS 
KPIEEIRELV SPFGDSLLVV GAEGYVKGHI HTNEPDALLA TVGRYGRMLK TKVEDMSEQH 
TEILGMAGAA ARAEEEIPPS GLVAVANGYG LVKLFRSLGA RIVSGGQTAN PSVQDIVDAV 
RSVSAEKVLI LPNNKNVLMA AEKATELLEG RAVIVPTRTL GQGIGAALAF QPDADAERLK 
AEMAEAAARV TTFEVTRASR TTNITTKDGV TLDIAEGDVI GLKDDELVQA GGTPEDSVLE 
MLNRNYAGQE IITVFGGPQK TQEDLDALAA RIGQEFPMAE VEAHLGGPDL YDYLVTLE