Gene Ndas_5235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5235
Symbol
ID	9249128
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	+
Start bp	388004
End bp	390349
Gene Length	2346 bp
Protein Length	781 aa
Translation table	11
GC content	70%
IMG OID
Product	ATP-dependent DNA helicase PcrA
Protein accession	YP_003683121
Protein GI	297564148
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00141788
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGTCCTCCC AAGAACAGCT TCTCGAAGGT CTGAACGGTC CCCAGCGCGA CGCCGTCACC 
CACAGCGGCT CCCCGCTCCT GATCGTGGCG GGTGCCGGGT CCGGCAAGAC CCGGGTCCTC 
ACCCACCGCA TCGCCCACCT CATGGCCGCG CGCGGTGTCC GCCCGGGTGA GATCCTCGCC 
ATCACCTTCA CCAACAAGGC CGCCGCCGAG ATGCGCGAGC GCATCCAGGC GCTGCTGGGC 
GTGCGCGCCG CCAACAGCAT GTGGACCATG ACCTTCCACT CCGCGTGCGT GCGCATCCTG 
CGCAGGGAGG CAGCCAGGCT CGGCTACCCG AGCAGCTTCA CCATCTACGA CTCCGCCGAC 
TCCGCGCGCC TGATGCAGCT GGTGTGCAAG GAGATGGACC TGGACCCCAA GCGGTTCCCG 
CCCAAGTCCT TCTCCGCCCA GGTCTCCAAC CTCAAGAACG AGCTGGTCGA CTACGACACG 
TTCGCCGGAC AGGCCCAGAC CGAGCAGGAG AAGAAGCTCG CCGAGGCCTA CCAGCTCTAC 
CAGCGCCGCC TGCACGAGGC GGGCGCGATG GACTTCGACG ACCTGATCAT GGTCACCGTC 
AACCTGTTCC AGATGTTCCC GGACGTCGCC GAGTACTACC GGCGCCGCTT CCGGCACGTC 
ATGGTCGACG AGTACCAGGA CACCAACCAC GCCCAGTACG TGTTCATCCG CGAACTGGTC 
GGCGTGGCCG AGGGCTCCGA CACCAGCGTG GTGCCGCCCG CTGAGCTGTG CGTGGTCGGC 
GACGCCGACC AGTCCATCTA CGCGTTCCGC GGCGCCACCA TCCGCAACAT CCTGGAGTTC 
GAGCGCGACT TCCCCGACGC GCGCACCATC CTCCTGGAGC AGAACTACCG CTCCACCCAG 
ACCATCCTGT CCGCGGCCAA CGCGGTCATC GACCGCAACG AGGGCCGCCC GGCCAAGAAC 
CTGTGGTCGG AGCAGGGCGA CGGACCGGCC ATCGTCGGCT ACGTCGCCGA CAACGAGCAC 
GACGAGGCCG CCTTCGTGGT CGGCGAGATC GACAAGCTCA CCGACGACGG AACCCTCACC 
CCGAGCCAGG TCGCGGTGTT CTACCGGACC AACGCCCAGT CCCGCGTGTT CGAGGACGTG 
TTCATCCGCA CCGGGCTGCC CTACAAGATC GTCGGCGGCG TGCGCTTCTA CGAGCGCAAG 
GAGATCCGCG ACGTCCTCGC CTACCTGCGG GTCCTGGCCA ATCCCGAGGA CACCGTCAGC 
CTGCGGCGCA TCCTCAACGT GCCCAAGCGG GGGATCGGCG CCCGCGCGGA GGAGTCGATC 
GAGCTGTTCG CCGCCCGCGA GCGCATCTCC TTCTCCCGGG CGCTGCGCCG GGTGGAGGAG 
ATCCCCGGGA TGGCCGCCCG CTCGGTCAAG GCGGTGCTCA ACTTCACCGC CCTGCTGGAG 
GAGCTGGAGC AGACCGTGCC CGAGGGCACG CCCGCGGAGA TCGTCGAGGC GGTGCTGAGC 
AAGACCGGGT ACCTGTCCGA ACTGGCCGAG TCCAAGGACC TCCAGGACGA GAGCCGGGTG 
GAGAACCTGG AGGAGTTCGT CGACGTCGCC CGCGAGTTCG AGCACACCTT CGCCGCCCTC 
CTGGAGGAGG AGCCCACGGA GGACGGGGAG GAGGCCGCCG GGGCCGTCGA TCCGGGGGCG 
CCGACCCTGG TCGACTTCCT GGAGCGGATC TCCCTGGTCG CCGACACCGA CCAGATCCCC 
GACGAGGACG ACGAGGGCGG CGTGGTCACG CTGATGACCC TGCACGCGGC CAAGGGGCTG 
GAGTTCCCCG CGGTCTTCCT CACCGGGATG GAGGACGGGG TGTTCCCGCA CACCCGCACG 
CTCGGCGACA AGACGCAGCT GGAGGAGGAG CGCCGTCTGG CCTACGTGGG CCTGACCCGC 
GCGCAGCGCC TGCTGTACGT CAGCCGCGCC GCCGTGCGCA GCGCCTGGGG GACCCCCTCC 
TACAACCCCG CCTCCCGCTT CCTGGACGAG ATCCCCTCGT CCCTGGTCGA CTGGCGCCGC 
GCCGAGTCCA CCCTGGCCGC CCCGCCCAGC CGCAGCATCG GCGGCCGGGG CTCCGGGGGC 
TTCGGCGGCG GGGGCGGTTT CAGCGGCACC TTCGGCGGCG GCTCACGGTC GCGCGGGGGA 
GCGAAGGCGG CCAAGGAGGC GCCCGCGCTC AGTGTGGGGG ACCTGGTCAA CCACGACTCC 
TTCGGCATGG GCCGGGTGCA GCTGGTGGAG GGGACCGGGG ACAGGACCAA GGCCCGCATC 
GACTTCGGCG CGGACATCGG CGAGAAGGAC TTCCTGGTCA AGTACGCGCC GATCGAGAAG 
CTCTGA

Protein sequence

MSSQEQLLEG LNGPQRDAVT HSGSPLLIVA GAGSGKTRVL THRIAHLMAA RGVRPGEILA 
ITFTNKAAAE MRERIQALLG VRAANSMWTM TFHSACVRIL RREAARLGYP SSFTIYDSAD 
SARLMQLVCK EMDLDPKRFP PKSFSAQVSN LKNELVDYDT FAGQAQTEQE KKLAEAYQLY 
QRRLHEAGAM DFDDLIMVTV NLFQMFPDVA EYYRRRFRHV MVDEYQDTNH AQYVFIRELV 
GVAEGSDTSV VPPAELCVVG DADQSIYAFR GATIRNILEF ERDFPDARTI LLEQNYRSTQ 
TILSAANAVI DRNEGRPAKN LWSEQGDGPA IVGYVADNEH DEAAFVVGEI DKLTDDGTLT 
PSQVAVFYRT NAQSRVFEDV FIRTGLPYKI VGGVRFYERK EIRDVLAYLR VLANPEDTVS 
LRRILNVPKR GIGARAEESI ELFAARERIS FSRALRRVEE IPGMAARSVK AVLNFTALLE 
ELEQTVPEGT PAEIVEAVLS KTGYLSELAE SKDLQDESRV ENLEEFVDVA REFEHTFAAL 
LEEEPTEDGE EAAGAVDPGA PTLVDFLERI SLVADTDQIP DEDDEGGVVT LMTLHAAKGL 
EFPAVFLTGM EDGVFPHTRT LGDKTQLEEE RRLAYVGLTR AQRLLYVSRA AVRSAWGTPS 
YNPASRFLDE IPSSLVDWRR AESTLAAPPS RSIGGRGSGG FGGGGGFSGT FGGGSRSRGG 
AKAAKEAPAL SVGDLVNHDS FGMGRVQLVE GTGDRTKARI DFGADIGEKD FLVKYAPIEK 
L