Gene Ndas_0702 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0702
Symbol
ID	9244544
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	864837
End bp	865976
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	71%
IMG OID
Product	chaperone protein DnaJ
Protein accession	YP_003678653
Protein GI	297559679
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCCAGAG ACTATTACCA GGTTCTCGGA GTGCGTCGCG ACGCGTCCAA GGACGAGATC 
AAGAAGGCCT ACCGGCGGCT CGCGCGCGAA CTCCACCCGG ACATCAATCC GGACCCCGCA 
ACCCAGGAGC GCTTCAAGGA GGTGACCCAG GCCTACGAGG TCCTCTCCGA CGAGAACAAG 
CGCCGGATGT TCGACATGGG CCAGGACCCC TACGCGCCCG GCGGCGGCGG GGCCGGGGGC 
TTCGGCGGCG CGGGCGGGTT CGCCTTCGAC GACATCATGA ACGCCTTCTT CGGCGGCGGC 
CAGCCCGGCG GGCGCGGCCC CCGGGAACGG GTCCGCCGCG GGCGCAGCAT CAAGATCCGC 
GTCGAACTCG ACCTGGTGGA GACCGCGTTC GGGGTCAGCA AGGAGATCAC CTTCCCCACC 
GCCATCCTGT GCGAGACCTG CCAGGGCGAG GGGACGGCGG CCGGTTCGCA CCGCACCACC 
TGTGAGATGT GCCACGGACA GGGCGAGGTC TCCCAGGTCA CGCGGTCCTT CCTCGGCCAG 
GTCATGACCT CCCGCCCCTG CCCCCAGTGC TCGGGCCAGG GCTCGGTCAT CACCAACCCC 
TGCGGCGACT GCGCGGGCGA GGGCCGGGTG CGCGAGAAGG TCACCCGCAC CGTCAAGATC 
CCCGCGGGCG TCGACGACGG CACCCGCATC CAGCTCGCCG GGGAGGGCGA GGTCGGCCCC 
AACGGCGGAC CGCGCGGCGA CATCATCCTG GAGATCATCC AGCGCCCGCA CCCCACCTTC 
GAACGTCGCG GCGACGACCT GCACTGCACG GTGACCGTCC CCATGACGGC CGCCGCGCTG 
GGCGCCTCCT TCGCCTTCGA CACCCTCGAC GGCACCGAGA ACATCGACCT GCGCCCGGGC 
ACCAACTCCG GCCACGTCAT CACCCTCCCC AACAAGGGCG TCAGCCACCT CGACGGCGGC 
GGCCGGGGCG ACCTGCGCAT CCGCGTCGAC GTGGAGACCC CGAGCAGGCT GGACGAGGAG 
CAGGAGGCCC TCCTGCGCAA GTTCGCCGAA CTGCGCGGCG AGGACCAGAC CCCGGGACGC 
TTCAGTCCCG GACACGGCGG GTTCTTCTCC AAGATCCGCG ACGCCTTCGG CGCCAAGTGA

Protein sequence

MARDYYQVLG VRRDASKDEI KKAYRRLARE LHPDINPDPA TQERFKEVTQ AYEVLSDENK 
RRMFDMGQDP YAPGGGGAGG FGGAGGFAFD DIMNAFFGGG QPGGRGPRER VRRGRSIKIR 
VELDLVETAF GVSKEITFPT AILCETCQGE GTAAGSHRTT CEMCHGQGEV SQVTRSFLGQ 
VMTSRPCPQC SGQGSVITNP CGDCAGEGRV REKVTRTVKI PAGVDDGTRI QLAGEGEVGP 
NGGPRGDIIL EIIQRPHPTF ERRGDDLHCT VTVPMTAAAL GASFAFDTLD GTENIDLRPG 
TNSGHVITLP NKGVSHLDGG GRGDLRIRVD VETPSRLDEE QEALLRKFAE LRGEDQTPGR 
FSPGHGGFFS KIRDAFGAK