Gene GSU0033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU0033
Symbol	dnaK
ID	2686137
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	42473
End bp	44383
Gene Length	1911 bp
Protein Length	636 aa
Translation table	11
GC content	61%
IMG OID	637124695
Product	molecular chaperone DnaK
Protein accession	NP_951095
Protein GI	39995144
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0443] Molecular chaperone
TIGRFAM ID	[TIGR02350] chaperone protein DnaK

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAAAG TGATCGGTAT CGACCTCGGC ACCACCAACT CCTGCGTTGC TGTTATGGAA 
GGTGGTGAGC CGGTTGTCAT AGCCAACGCC GAAGGAAGCC GCACCACCCC GTCCATGGTC 
GCATTCGCCG AGAGCGGCGA GCGGCTGGTG GGCCAGCAGG CCAAGCGTCA GGCGGTGACC 
AATCCGGAGA ACACCCTGTT CGCCATCAAG CGGCTCATCG GCCGTAAGTA CGATACGGAA 
GAGGTGCGCA AGGACATCTC CATCTCCCCC TTCAAGATCG TCAAGGCCGA CAACGGTGAC 
GCCTGGGTTG AGGCCCGCGG CAAGATGTAC TCGGCCCCTG AGATCTCGGC CATGGTGCTC 
CAGAAGATGA AGCAGACAGC CGAGGACTAC CTGGGCGAGA CCGTGACCGA CGCGGTCATC 
ACCGTGCCGG CCTACTTCAA CGACTCCCAG CGCCAAGCCA CCAAGGACGC CGGCAAGATC 
GCCGGCCTGA ACGTCCTGCG GATCATCAAC GAGCCGACCG CCGCCGCATT GGCTTATGGC 
CTCGACAAGA AGAAGGACGA GAAGATTGCC GTTTTCGACC TGGGGGGCGG AACTTTCGAC 
ATCTCCATCC TGGAACTGGG TGACGGCGTC TTCGAGGTGA AGTCCACCAA CGGCGACACC 
TTCCTGGGTG GCGAAGACTT CGACCAGCGG GTCATCGACT GGATCGCCGA CGAATTCAAG 
AAGGACCAGG GGATCGACCT GCGCGGCGAC AAGATGGCCC TGCAGCGCCT CAAGGAGGCC 
GCCGAGAAGG CCAAGTGCGA GCTCTCCACC TCCATGGAGA CCGATATCAA CCTTCCCTTT 
ATCACCGCTG ATGCAACCGG GCCCAAGCAC CTCACCATGA AGCTGTCCCG GGCTAAGCTG 
GAGGCCCTGT GCGCCGACCT GCTCAACAAG CTGGAGGGGC CCTGCCGCAC CGCGCTCAAG 
GATGCCGGTC TGTCTCCCTC CGAGGTGGAC GAAGTGATTC TGGTCGGCGG CATGACACGG 
ATGCCGGCGG TCCAGAAAAG GGTTCAGGAG ATATTCGGCA AGGTTCCCAA CAAGGGGGTT 
AACCCCGATG AGGTGGTCGC CATCGGCGCC GCCATTCAGG GCGGGGTGCT CAGGGGCGAC 
GTGAAGGACG TGCTGTTGCT CGACGTGACC CCCCTTTCGC TCGGCATCGA GACCCTCGGC 
AGCGTCATGA CCAAGCTCAT CGAGAAGAAC ACCACCATCC CGTGCCGCAA GAGCCAGGTC 
TTCTCCACGG CCAGCGACAA TCAGCCGGCG GTAACCATCC ACGTGCTCCA GGGAGAGCGG 
GAGATGGCGA TCGACAACAA GACATTGGGG AACTTCGAGC TGACCGGCAT CCCGCCGGCG 
CCCCGCGGGG TCCCCCAGAT CGAGGTAACC TTCGATATCG ACGCCAACGG CATCGTTCAT 
GTTTCCGCCA AGGATTTGGG CACCGGCAAG GAGCAATCCA TCAGGATCAC TGCATCCTCC 
GGCCTCTCCA AGGAAGAGAT CGACAAGATG GTCAAGGAGG CAGAAGCTCA TTCAGCCGAG 
GACAAGAAGA AGCGGGAGCT GGTGGAAGCC CGCAATCACG CTGATACCCT CAGCTACTCA 
ACCGAGAAGT CTCTCAAGGA ATACGGGGAC AAGATCGGTG CCGACGAGAA AGCCAAGATC 
GAGGAATGCC TGGCAAACCT CAGAAAGGCC ATGGAGGGAA GCGACGTAGA GGTCCTCAAG 
AAGGCCACGG ACGAGCTGAC CCAAGCGTCT CACAAGCTGG CAGAGGCGGT CTACGCCAAA 
GCCCAGGCCG AAGGCGCCCA ACCAGGCGGG GAAGCGGCGG GTGAAGCCTC TGCCAAGGAT 
GAGAAGGTTG TCGACGCCGA CTTTGAAGAG GTCAAGGACG ACAAGAAATA A

Protein sequence

MSKVIGIDLG TTNSCVAVME GGEPVVIANA EGSRTTPSMV AFAESGERLV GQQAKRQAVT 
NPENTLFAIK RLIGRKYDTE EVRKDISISP FKIVKADNGD AWVEARGKMY SAPEISAMVL 
QKMKQTAEDY LGETVTDAVI TVPAYFNDSQ RQATKDAGKI AGLNVLRIIN EPTAAALAYG 
LDKKKDEKIA VFDLGGGTFD ISILELGDGV FEVKSTNGDT FLGGEDFDQR VIDWIADEFK 
KDQGIDLRGD KMALQRLKEA AEKAKCELST SMETDINLPF ITADATGPKH LTMKLSRAKL 
EALCADLLNK LEGPCRTALK DAGLSPSEVD EVILVGGMTR MPAVQKRVQE IFGKVPNKGV 
NPDEVVAIGA AIQGGVLRGD VKDVLLLDVT PLSLGIETLG SVMTKLIEKN TTIPCRKSQV 
FSTASDNQPA VTIHVLQGER EMAIDNKTLG NFELTGIPPA PRGVPQIEVT FDIDANGIVH 
VSAKDLGTGK EQSIRITASS GLSKEEIDKM VKEAEAHSAE DKKKRELVEA RNHADTLSYS 
TEKSLKEYGD KIGADEKAKI EECLANLRKA MEGSDVEVLK KATDELTQAS HKLAEAVYAK 
AQAEGAQPGG EAAGEASAKD EKVVDADFEE VKDDKK