Gene Ndas_5471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5471
Symbol
ID	9249374
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	-
Start bp	661432
End bp	663282
Gene Length	1851 bp
Protein Length	616 aa
Translation table	11
GC content	68%
IMG OID
Product	chaperone protein DnaK
Protein accession	YP_003683356
Protein GI	297564383
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACGTG CGGTCGGAAT CGACCTCGGT ACGACGAACT CGTGTGTCGC GGTCCTGGAG 
GGCGGCGAGC CCACGGTCAT CGCCAACGCC GAGGGCGCCC GTACCACCCC GTCCGTCGTC 
GCCTTCGCCA AGAACGGTGA GGTGCTCGTC GGCGAGGTCG CCAAGCGCCA GGCGGTCACC 
AACGTCGACC GCACCATCCG CTCGGTCAAG CGCCACATCG GCACCGACTG GACGGTGAAG 
ATCGACGACA AGACCTTCAA CCCCCAGCAG ATCAGCGCCT TCGTGCTCCA GAAGCTCAAG 
CGCGACGCCG AGGCCTACCT GGGCGAGGAC GTGACCGACG CGGTCATCAC CGTCCCGGCC 
TACTTCAGCG ACTCCCAGCG CCAGGCCACC AAGGAGGCCG GCACCATCGC GGGCCTCAAC 
GTCCTGCGCA TCATCAACGA GCCGACCTCG GCCGCGCTGG CCTACCACCT GGAGAAGGAG 
GACGAGGCCA CCATCCTGGT CTACGACCTC GGTGGCGGCA CCTTCGACGT CTCCCTCCTG 
GAGGTCGGCG ACGGCGTCGT GGAGGTCAAG GCGACCAACG GCGACAACCA CCTGGGCGGC 
GACGACTGGG ACCAGGCCAT CGTCGACTGG CTGGTCGAGC GCTTCAAGAA CTCCAACGGC 
GTGGACCTGT CCAAGGACAA GATGGCCCTC CAGCGCCTGC GCGAGGCCGC GGAGAAGACC 
AAGATCGAGC TGTCCAGCTC CAGCGAGTCG GCGATCAACC TGCCCTACAT CACGGCCTCG 
GCCGAGGGCC CGCTGCACCT GGACGAGAAG CTCTCCCGCG CCGAGTTCCA GCGCCTGACC 
GCCGACCTGG TCGAGCGGAC CAAGACCCCG TTCCAGCAGG TCCTCAAGGA CGCCGGGATC 
AGCCTGGACC AGATCCACCA CGTGGTCATG GTCGGCGGCT CCACCCGTAT GCCCGCCATC 
GTGGACCTGG TCAAGGAGAT GACCGGCAAG GACCCCAACA AGGGCGTCAA CCCGGACGAG 
GTCGTGGCCA TCGGCGCCTC GCTCCAGGCC GGTGTGCTCA AGGGCGAGGT CAAGGACGTC 
CTGCTGCTGG ACGTCACCCC GCTGTCGCTG GGCATCGAGA CCAAGGGCGG CGTGTTCACC 
AAGCTCATCG AGCGCAACAC GACCATCCCG ACCAAGCGCT CCGAGATCTT CACGACGGCC 
GACGACAACC AGCCGTCCGT GCAGATCCAG GTGTACCAGG GTGAGCGCGA CATCGCCCAG 
TACAACAAGA AGCTGGGCGT CTTCGACCTG ACCGGTCTGC CCCCGGCGCC GCGCGGCGTC 
CCGCAGATCG AGGTCGCCTT CGACATCGAC GCCAACGGCA TCGTCAGCGT CACCGCGAAG 
GACCTGGGCA CCGGCAAGGA GCAGTCCGTC ACCATCTCCG GCGGCTCCGC GATGTCCAAG 
GACGACATCG ACAAGATGGT CCGCGAGGCC GAGCAGTACG CGGAGGAGGA CCGCAAGCGC 
CGCGAGGAGG CCGAGGTCCG CAACAACGCC GAGTCCCTCG TCTACCAGAC CGAGAAGGTC 
ATCAAGGACA ACGAGGACAA GGTCCCGGCG GACGTGCGCT CCGAGACCGA GGCCGCCGTC 
GCCGAGCTGA AGACCGCGCT GGAGGGCTCC GACGTGGAGG CCATCCGCAC CGCGAGCGAG 
AAGGTCGCGC TGGCCAGCCA GAAGATCGGC TCCGCCATCT ACAGCCAGGG CCAGCAGGGC 
GCCGAGGGCG ACGCCCAGGG CGCCCAGAGC TCCGCCGACG ACGCCGACGT CGTGGACGCC 
GAGATCGTCG ACGAGGACAA CAAGGGCACC CAGGGCAACC AGCAGTCCTG A

Protein sequence

MARAVGIDLG TTNSCVAVLE GGEPTVIANA EGARTTPSVV AFAKNGEVLV GEVAKRQAVT 
NVDRTIRSVK RHIGTDWTVK IDDKTFNPQQ ISAFVLQKLK RDAEAYLGED VTDAVITVPA 
YFSDSQRQAT KEAGTIAGLN VLRIINEPTS AALAYHLEKE DEATILVYDL GGGTFDVSLL 
EVGDGVVEVK ATNGDNHLGG DDWDQAIVDW LVERFKNSNG VDLSKDKMAL QRLREAAEKT 
KIELSSSSES AINLPYITAS AEGPLHLDEK LSRAEFQRLT ADLVERTKTP FQQVLKDAGI 
SLDQIHHVVM VGGSTRMPAI VDLVKEMTGK DPNKGVNPDE VVAIGASLQA GVLKGEVKDV 
LLLDVTPLSL GIETKGGVFT KLIERNTTIP TKRSEIFTTA DDNQPSVQIQ VYQGERDIAQ 
YNKKLGVFDL TGLPPAPRGV PQIEVAFDID ANGIVSVTAK DLGTGKEQSV TISGGSAMSK 
DDIDKMVREA EQYAEEDRKR REEAEVRNNA ESLVYQTEKV IKDNEDKVPA DVRSETEAAV 
AELKTALEGS DVEAIRTASE KVALASQKIG SAIYSQGQQG AEGDAQGAQS SADDADVVDA 
EIVDEDNKGT QGNQQS