Gene Ndas_0839 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0839
Symbol
ID	9244684
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	1030176
End bp	1031324
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	75%
IMG OID
Product	Holliday junction DNA helicase RuvB
Protein accession	YP_003678789
Protein GI	297559815
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.153919
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.116315
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTACGACT TCCACGAGGA AGACCCCCGG GGCTCGGCCC CCGGCGGGCC CCCGCCCTAC 
GAGCGCGACG CGGTCTCGCC CGACGCGGGC ACGGACGAGC GCCAGATCGA GGGCGCCCTG 
CGCCCCCGCG CCCTGGACGA GTTCGTCGGC CAGGAACGCG TGCGCGAACA GCTCTCCCTG 
GTGCTGCACA GCGCCAAGCG GCGCAACCGG GCGCCCGACC ACATCCTCAT GTCCGGCGGC 
CCGGGCCTGG GCAAGACCAC CCTGGCCATG ATCATCGCCG CCGAGATGGG GGCCCCGCTG 
CGCATCACCT CGGGCCCGGC CATCGAGCGC TCCGGGGACC TGGCCGCGGT GCTCTCCACC 
CTCCAGGAGG GCGAGGTGCT CTTCCTGGAC GAGATCCACC GCATGGCCCG CCCCGCCGAG 
GAGATGCTCT ACGTCGCGAT GGAGGACTTC CGGGTCGACG TCGTGGTCGG CAAGGGCCCC 
GGCGCCACCG CCATCCCGCT GGACATCGCG CCGTTCACCC TGGTCGGGGC CACCACCCGT 
GCGGGCATGC TGCCCGCGCC CCTGCGCGAC CGCTTCGGAT TCACCGCGCA CATGGACTTC 
TACACCCCCC AGGAACTGGA GCTGATCCTC CAGCGCTCGG CGGGTCTGCT CGGCGCGCCC 
CTGGACGCGG ACGCGGCCGT GGAGATCGCC GGGCGCTCGC GCGGCACCCC CCGGATCGCC 
AACCGGCTGC TGCGCCGGGT GCGCGACTAC GCCGAGGTGC GCGGGAACGG GCGGCTGTCG 
CTGGACACCG CCCGCGCCGC CCTCGACCTC TACGAGGTGG ACGAACTGGG CATGGACCGG 
CTGGACCGCG CCATCCTCGA CGTGCTCATG AGGAGGTTCC GCGGCGGCCC GGTCGGCCTG 
TCCACGCTGG CGGTGTCGGT GGGGGAGGAG GCCGAGACGG TGGAGACCGT CGCCGAGCCC 
TTCCTGGTCC GCTCCGGCTT CCTGGCCCGC ACCCCGCGGG GCCGGGTGGC CACCCCGCAG 
GCCTGGGCGC ACATGGGGCT CACCCCGCCG CCGGACGCGG CCTTCGGCGC GGCGGCGGCC 
AACGGCGGCG GCGCCGGTAA CCCCGCCCCC GCGGGCAACG CGGGTCACAA CGGTGCGGCG 
AGTCCCTGA

Protein sequence

MYDFHEEDPR GSAPGGPPPY ERDAVSPDAG TDERQIEGAL RPRALDEFVG QERVREQLSL 
VLHSAKRRNR APDHILMSGG PGLGKTTLAM IIAAEMGAPL RITSGPAIER SGDLAAVLST 
LQEGEVLFLD EIHRMARPAE EMLYVAMEDF RVDVVVGKGP GATAIPLDIA PFTLVGATTR 
AGMLPAPLRD RFGFTAHMDF YTPQELELIL QRSAGLLGAP LDADAAVEIA GRSRGTPRIA 
NRLLRRVRDY AEVRGNGRLS LDTARAALDL YEVDELGMDR LDRAILDVLM RRFRGGPVGL 
STLAVSVGEE AETVETVAEP FLVRSGFLAR TPRGRVATPQ AWAHMGLTPP PDAAFGAAAA 
NGGGAGNPAP AGNAGHNGAA SP