Gene Dgeo_2076 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_2076
Symbol	dnaK
ID	4058173
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008025
Strand	+
Start bp	2186109
End bp	2187998
Gene Length	1890 bp
Protein Length	629 aa
Translation table	11
GC content	65%
IMG OID	641231115
Product	molecular chaperone DnaK
Protein accession	YP_605539
Protein GI	94986175
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0443] Molecular chaperone
TIGRFAM ID	[TIGR02350] chaperone protein DnaK

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000834222
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGAAAG CTGTCGGAAT CGACCTCGGA ACCACCAACA GCGTGATCGC CACGATGGAA 
GGCGGACGCC CAGAAGTGAT CGTGAATGCG GAAGGGGCGC GTACCACCCC CTCCGTTGTC 
GCGTACAAGG GGGACGAGCG CCTGGTCGGG CAGATCGCCC GCCGTCAGGC CGCGCTGAAC 
CCCAAGGCCA CCCTGTTCGA AGTCAAGCGT TTTATCGGTC GCCGCTGGGA TGAGGTCAAG 
GAAGAGGCCG CCCGCATGCC CTTTACGGTG AAGGAAGGCC CGGGCGGGTC TGTGCGCATC 
GAGGTGAATG GCAAGGACCT CGCCCCGGAG CAGGTGAGCG CCGAGGTGCT GCGCAAGCTG 
GTTGCGGACG CCAGCGCCAA GCTGGGCGAA AAGATCACCG ACGCCGTGAT CACCGTGCCC 
GCCTACTTCG ACAACTCGCA GCGCGAGGCC ACCAAGCAGG CGGGTGAGAT CGCAGGCTTG 
AACGTGCTGC GTGTGATCAA CGAGCCGACT GCCGCGGCGC TGGCCTACGG CCTGGAGCGC 
AAGGGCAACG AGACGGTGCT GGTCTTTGAC CTGGGTGGCG GCACCTTTGA CGTGACCATC 
CTGGAACTGG GCGAGGGTGT CTTCGAGGTG CGTTCGACCG CCGGTGACAC GCACCTGGGC 
GGCGCGGACT TTGACCAGCG CATCGTGAAC TGGCTGGCCG AGGAATTCAG GAAGGAGCAC 
AACTTCGACC TGCGCAAGGA TCCGCAGGCC CTCCAGCGCC TGATCGAGGC TGCCGAGCGC 
GCCAAGATCG AACTCAGCAA CGCCTCCGAG ACCACCATCA GCCTTCCTTT CATCACCTTT 
GACCCCGAGA CGCGCACGCC CCTGCACCTG GAGCGTACCC TGAGCCGCGC GAAGTTCGAA 
GAACTCACCG CCGACCTGCT GAGGCGCGTA CGTCAGCCCG TCGAGCAGGC GCTTGCCGAC 
GCCAAGCTGA GCGCCAGCGA TATCGACGAG GTGATTCTGG TGGGCGGCTC CACCCGTATC 
CCCGCGGTCA AGCGCATCGT GAAGGAGATC ACCGGCAAGG AGCCCAACGA GTCGGTCAAC 
CCCGACGAGG CGGTCGCGCT GGGGGCCGCG GTGCAGGCGG GCATCATTCA GGGTGACGCC 
AACCTGGGTG ACATCGTGCT GGTCGACGTC ACGCCCCTCA CGCTGGGGGT GGAGGTCAAG 
GGCGGGATGG TCGCGCCGAT GATTCCCCGC AACACCACCA TCCCCGCCAA GAAGACCGAG 
ATCTACACCA CCGCCGAGAA CAACCAGCCG GGCGTAGAGA TCGTGGTGCT CCAGGGCGAG 
CGTCCCATGG CCGCCGACAA CAAGTCCCTG GGCCGCTTCA AGCTCGAAGG CATCCCGCCG 
ATGCCCGCTG GACGGCCGCA GATCGAGGTC ACCTTTGACA TCGACGCGAA CGGCATCCTG 
CACGTCACGG CCAAGGAAAA GACCAGCGGC AAGGAAGCCA GCATCCGCAT CGAGAACACC 
ACCACCCTCG ACAAGAGCGA CGTGGAACGG ATGGTGAAGG AAGCCGAGCA GAACGCCGAA 
GCCGACCGCA AGCGCCGCGA GCGGGTCGAG AAGCGCAACA ATCTCGACAG CCTGCGTGTG 
CAGGCCCTGG GCCAGCTCGA GGAGAACCAG AGCGCACCCC AAGACGCCAA GGACCGCCTG 
AAGGCGGCTG CCGACGAGGC TGAGGAGGCA GTGCGCAGTG ACGACGACAG CCGGATCGAG 
CGCGCCCAAA AGCAGCTCGA AGAGGCCATG CGGTCCTTCA TGACCGCAGC GCAAAGTGGC 
AGCCAGAACC AGGCCGGTCA AGGCGCCCAG ACCCAGACAG GCCGCCAGGA AGACGACGTG 
ATCGACGCCG ACTTCAAGCC CGCTGAGTAA

Protein sequence

MPKAVGIDLG TTNSVIATME GGRPEVIVNA EGARTTPSVV AYKGDERLVG QIARRQAALN 
PKATLFEVKR FIGRRWDEVK EEAARMPFTV KEGPGGSVRI EVNGKDLAPE QVSAEVLRKL 
VADASAKLGE KITDAVITVP AYFDNSQREA TKQAGEIAGL NVLRVINEPT AAALAYGLER 
KGNETVLVFD LGGGTFDVTI LELGEGVFEV RSTAGDTHLG GADFDQRIVN WLAEEFRKEH 
NFDLRKDPQA LQRLIEAAER AKIELSNASE TTISLPFITF DPETRTPLHL ERTLSRAKFE 
ELTADLLRRV RQPVEQALAD AKLSASDIDE VILVGGSTRI PAVKRIVKEI TGKEPNESVN 
PDEAVALGAA VQAGIIQGDA NLGDIVLVDV TPLTLGVEVK GGMVAPMIPR NTTIPAKKTE 
IYTTAENNQP GVEIVVLQGE RPMAADNKSL GRFKLEGIPP MPAGRPQIEV TFDIDANGIL 
HVTAKEKTSG KEASIRIENT TTLDKSDVER MVKEAEQNAE ADRKRRERVE KRNNLDSLRV 
QALGQLEENQ SAPQDAKDRL KAAADEAEEA VRSDDDSRIE RAQKQLEEAM RSFMTAAQSG 
SQNQAGQGAQ TQTGRQEDDV IDADFKPAE