Gene Saro_2054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2054
Symbol	dnaK
ID	3917701
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	2195435
End bp	2197342
Gene Length	1908 bp
Protein Length	635 aa
Translation table	11
GC content	64%
IMG OID	640444806
Product	molecular chaperone DnaK
Protein accession	YP_497327
Protein GI	87200070
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0443] Molecular chaperone
TIGRFAM ID	[TIGR02350] chaperone protein DnaK

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAAAG TTATCGGCAT CGACCTGGGT ACGACCAACA GCTGCGTTGC GGTGATGGAC 
GGGGGCACGC CCAAGGTCAT TGAGAACTCG GAAGGTGCGC GCACCACGCC GTCGATCGTC 
GCCTTCACCA AGGATGGCGA GCGTCTGATC GGCCAGCCGG CCAAGCGCCA GGCGGTGACG 
AACCCGGACA ACACGATTTT CGCGGTGAAG CGCCTCATCG GCCGCCGCTT TGACGATCCG 
ATGACCCAGA AGGACACGGA ACTCGTCCCC TACACCATCA CCAAGGGCAA GAACGGCGAC 
GCCTGGGTCA AGGCGGGCGG GCAGGACTAC AGCCCTTCGC AGATCTCGGC CTTCACCCTG 
CAGAAGATGA AGGAAACCGC CGAGGCCTAT CTCGGCGAGA CCGTGACGCA GGCGGTGATC 
ACCGTTCCGG CATACTTCAA CGACGCGCAG CGCCAGGCGA CCAAGGACGC CGGCCAGATC 
GCGGGCCTCG AAGTGCTGCG CATCATCAAC GAGCCGACCG CGGCGGCGCT GGCCTATGGC 
CTCGACAAGC AGGACGGCAA GACGATCGCG GTCTATGACC TTGGCGGCGG CACCTTCGAC 
ATCTCGATCC TCGAGATCGG CGATGGCGTG TTCGAGGTGA AGTCGACCAA CGGCGACACC 
TTCCTCGGCG GCGAAGACTT CGACACCGCG GTGGTCGAGT ATCTGGCGGA CAAGTTCAAG 
GCCAAGGAAG GCATGGACCT GAAGACCGAC AAGCTCGCCC TGCAGCGCCT GAAGGAAGCG 
GCGGAAAAGG CCAAGATCGA GCTTTCGTCG GCACAGACGA CCGAGATCAA CCTGCCGTTC 
ATCACGGCCC GCATGGAAGG CGGCGCGACC ACGCCGCTGC ACCTGGTGGA AACCGTCACC 
CGCGCCGACC TTGAAAAGCT TGTCGCCGGC CTGATCCAGC GCACGCTCGA TCCGTGCAAG 
AAGGCGCTGG CCGATGCCGG CATCTCGGCC AAGGAGATCG ACGACGTCGT TCTCGTGGGC 
GGCATGACCC GCATGCCCAA GGTCCGCGAA GTGGTGAAGG ACTTCTTCGG CAAGGAACCG 
CACACCGGCG TGAATCCTGA CGAAGTCGTG GCGATGGGCG CGGCAATCCA GGCCGGCGTT 
CTCCAGGGCG ACGTCAAGGA CGTGCTGCTT CTCGACGTGA CCCCGCTTTC GCTGGGCATC 
GAGACGCTGG GCGGCATCAT GACCAAGATG ATCGACCGCA ACACCACGAT CCCGACCAAG 
AAGAGCCAGG TCTATTCGAC TGCCGAGGAC AATCAGCAGG CGGTGACGAT CCGGGTCTTC 
CAGGGCGAAC GCGAAATGGC GCAGGACAAC AAGCTCCTTG GCCAGTTCGA CCTCGTCGGC 
ATCCCGCCCG CACGGCGCGG CGTGCCGCAG ATCGAGGTGA CGTTCGATAT CGACGCCAAT 
GGCATCGTCA ACGTCTCGGC CAAGGACAAG GGCACCGGCA AGGAGCAGCA GATCCGCATC 
CAGGCCTCGG GCGGTCTTTC GGACGCAGAC ATCGACCAGA TGGTCCGCGA TGCCGAGAAG 
TTCGCTGAAG AGGACAAGAA GCGCCGTGCG GCGGCCGAGG CGAAGAACAA CGCCGAAAGC 
CTGATCCATG CGACCGAGCG CCAGCTTGAG GAAAACGGGG ACAAGGTCGA CGCGGGCCTC 
AAGGCCGAGA TCGAAGCGGC CATCGCCGAG GCGAAGACAG CCGTCGAGAG CGGCGACATC 
GACGCCATGA ACGCCAAGGC GCAGGCCCTG ACGGACAAGG CCATGAAGAT GGGCCAGGCC 
ATCTACGAGA AGGAGCAGGC AACTGCGGCT TCTCCGGGTG CCGAAGCCCC GAAGGCCGAC 
GATGACGTCG TCGACGCCGA GTTCTCGGAA GTCGACGAGA ACAAGTGA

Protein sequence

MAKVIGIDLG TTNSCVAVMD GGTPKVIENS EGARTTPSIV AFTKDGERLI GQPAKRQAVT 
NPDNTIFAVK RLIGRRFDDP MTQKDTELVP YTITKGKNGD AWVKAGGQDY SPSQISAFTL 
QKMKETAEAY LGETVTQAVI TVPAYFNDAQ RQATKDAGQI AGLEVLRIIN EPTAAALAYG 
LDKQDGKTIA VYDLGGGTFD ISILEIGDGV FEVKSTNGDT FLGGEDFDTA VVEYLADKFK 
AKEGMDLKTD KLALQRLKEA AEKAKIELSS AQTTEINLPF ITARMEGGAT TPLHLVETVT 
RADLEKLVAG LIQRTLDPCK KALADAGISA KEIDDVVLVG GMTRMPKVRE VVKDFFGKEP 
HTGVNPDEVV AMGAAIQAGV LQGDVKDVLL LDVTPLSLGI ETLGGIMTKM IDRNTTIPTK 
KSQVYSTAED NQQAVTIRVF QGEREMAQDN KLLGQFDLVG IPPARRGVPQ IEVTFDIDAN 
GIVNVSAKDK GTGKEQQIRI QASGGLSDAD IDQMVRDAEK FAEEDKKRRA AAEAKNNAES 
LIHATERQLE ENGDKVDAGL KAEIEAAIAE AKTAVESGDI DAMNAKAQAL TDKAMKMGQA 
IYEKEQATAA SPGAEAPKAD DDVVDAEFSE VDENK