Gene Caul_0004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0004
Symbol	dnaK
ID	5897716
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	5803
End bp	7698
Gene Length	1896 bp
Protein Length	631 aa
Translation table	11
GC content	65%
IMG OID	641560487
Product	molecular chaperone DnaK
Protein accession	YP_001681640
Protein GI	167643977
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0443] Molecular chaperone
TIGRFAM ID	[TIGR02350] chaperone protein DnaK

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0827361
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAGA TTATCGGTAT CGACCTTGGC ACCACGAATT CGTGCGTGGC CATCATGGAC 
GGCAAGACCC CGAAGGTGAT CGAGAACGCC GAGGGCGCTC GCACCACCCC GTCGGTGGTG 
GCCTTTCTCG AGGACGGCGA ACGCCTTGTC GGCCAGCCGG CCAAGCGCCA GGCCGTCACC 
AACCCGACCA ACACCCTTTT CGCGATCAAG CGCCTGATCG GCCGTAACTT CGCCGATCCC 
GTCGTGGCCA AGGACAAGGC CATGGTCCCC TACGAGATCG TCAAGGGTCC GACCGGCGAC 
GCCTGGGTCA AGGCCCACGG CAAGGACTAC AGCCCGCAGG AAGTCTCCGC CTTCATCCTG 
CAGAAGATGA AGGAAGCGGC CGAGAGCCAT CTGGGCGAGC CGGTGACCAA GGCGGTCATC 
ACCGTTCCGG CCTATTTCAA CGACGCCCAG CGTCAGGCGA CCAAGGACGC CGGCAAGATC 
GCCGGCCTGG AAGTCCTGCG CATCATCAAC GAGCCGACCG CGGCCGCCCT GGCCTACGGC 
CTGGAAATGA ACGAAGGCAA GAAGATCGCC GTCTACGACC TGGGCGGCGG CACCTTCGAC 
GTCTCGGTCC TGGAAATCGG CGACGGCGTC TTCGAAGTGA AGTCGACCAA CGGCGACACC 
TTCCTGGGCG GCGAGGACTT CGACCTGCGG ATCGTCGACT ACCTGGCCGA CGAGTTCAAG 
AAGGAGCAGG GCGTCGACCT GCGCAAGGAC AAGCTGGCCC TGCAGCGTCT GCGCGAAGAG 
GCTGAAAAGG CCAAGAAGGA GCTGTCCTCG ACGGCTCAGT ACGAAGTCAA CCTGCCCTTC 
ATCTCGATGA ACGCGTCGGG TCCGCTGCAT CTGAACATCA AGCTGTCGCG CTCCAAGCTC 
GAAGCCCTGG TGGAAGACCT GATCACGCGC ACCATCGGTC CGTGCGAACA GGCCCTCAAG 
GACGCCGGCC TGAAGAAGAG CGACATCGAC GAAGTGATCC TGGTCGGCGG CATGAGCCGC 
ATGCCCAAGG TCCAGCAGGC GGTGCAGGAC TTCTTCGGCC GCGAGCCGCA CAAGGGCGTG 
AACCCTGACG AAGTCGTGGC CCTGGGCGCC GCCGTTCAGG CCGGCGTGCT GCAAGGCGAC 
GTCAAGGACG TGCTGCTGCT GGACGTGACC CCTCTGACCC TGGGCATCGA GACCCTGGGC 
GGCGTGTTCA CCCCGCTGAT CGAGCGCAAC ACCACCATCC CGACCAAGCG CTCGCAGACC 
TTCTCGACCG CCGACGACAA CCAGTCGGCG GTGACGATCC GCGCCTTCCA GGGCGAGCGT 
CCGATGGCCG TCGACAACAA GTTCCTGGGT CAGTTCGACC TGCAGGGCAT TCCGCCGGCG 
CCGCGCGGCG TGCCGCAGAT CGAGGTCACC TTCGACATCG ACGCCAACGG CATCGTCAAC 
GTCCACGCCA AGGACAAGGC GACCAACAAG GAGCACTCGA TCCGCATCCA GGCCAACGGC 
GGCCTGAGCG ACGCGGACAT CGAGCGTATG GTCAAGGAAG CCGAGGCCAA CAAGGCTTCG 
GACGAGAAGA AGAAGGCGCT GGTCGAGGCC AAGAACCAGG GCGAGGCCAT CGTGCACTCG 
ACCGAGAAGG CCTTCGCCGA ACACGGCGAC AAGATCGGCG GGGCCGAGAA GACCGCGATC 
GAGACCGGCC TGACCGATCT GAAGGCGGCC CTGGAAGGCG AGGACGTCGA GGCCATCCAG 
GCCAAGACCC AGGCCCTGAT CCAGGCGTCG ATGAAGCTCG GCGAAGCGAT GTACGGCGCC 
CAGCAAGGCG CCGACGGCGG CGAGGAAGCC GCCCACGATG ACGGCGTCGT CGACGCCGAA 
TTCGAGGAAG TCGACGACTC CAAGCCGTCG GCGTGA

Protein sequence

MSKIIGIDLG TTNSCVAIMD GKTPKVIENA EGARTTPSVV AFLEDGERLV GQPAKRQAVT 
NPTNTLFAIK RLIGRNFADP VVAKDKAMVP YEIVKGPTGD AWVKAHGKDY SPQEVSAFIL 
QKMKEAAESH LGEPVTKAVI TVPAYFNDAQ RQATKDAGKI AGLEVLRIIN EPTAAALAYG 
LEMNEGKKIA VYDLGGGTFD VSVLEIGDGV FEVKSTNGDT FLGGEDFDLR IVDYLADEFK 
KEQGVDLRKD KLALQRLREE AEKAKKELSS TAQYEVNLPF ISMNASGPLH LNIKLSRSKL 
EALVEDLITR TIGPCEQALK DAGLKKSDID EVILVGGMSR MPKVQQAVQD FFGREPHKGV 
NPDEVVALGA AVQAGVLQGD VKDVLLLDVT PLTLGIETLG GVFTPLIERN TTIPTKRSQT 
FSTADDNQSA VTIRAFQGER PMAVDNKFLG QFDLQGIPPA PRGVPQIEVT FDIDANGIVN 
VHAKDKATNK EHSIRIQANG GLSDADIERM VKEAEANKAS DEKKKALVEA KNQGEAIVHS 
TEKAFAEHGD KIGGAEKTAI ETGLTDLKAA LEGEDVEAIQ AKTQALIQAS MKLGEAMYGA 
QQGADGGEEA AHDDGVVDAE FEEVDDSKPS A