Gene Ndas_0965 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0965
Symbol
ID	9244810
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	1182940
End bp	1185039
Gene Length	2100 bp
Protein Length	699 aa
Translation table	11
GC content	70%
IMG OID
Product	excinuclease ABC, B subunit
Protein accession	YP_003678915
Protein GI	297559941
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGACCGG TCAGCGACAT CAAACGCAGC GAGGCGCCCT TCGAGGTGAT CTCGGAGATG 
ACCCCGGCGG GGGACCAGCC GGGCGCGATC GCCGAGATCA GCAGGAGGGT GCGGGACGGG 
GAGCCGCACA CGGTGCTGCT CGGCGCGACC GGCACCGGCA AGACGGCGAC CGTGGCGTGG 
ACGGTGGAGC AGCTCCAGCG GCCCACCCTG GTGATGCAGC CCAACAAGAC CCTGGCGGCG 
CAGTTCGCCA ACGAGCTGCG CCAGATGCTG CCCAACAACG CCGTCGAGTA CTTCGTGTCG 
TACTACGACT ACTACCAGCC CGAGGCCTAC GTCCCGCAGA GCGACACCTT CATCGAGAAG 
GACTCCTCCA TCAACGACGA GGTCGAGCGG CTGCGCCACT CGGCCACCAA CTCGCTGCTC 
ACGCGCCGGG ACACGATCGT GGTCGCCTCG GTCTCGTGCA TCTACGGTCT GGGCACCCCG 
CAGGAGTACG TGGACCGGAT GGCGCAGCTG GCGGTGGGCA TGGAGGTCGA CCGCGACGAC 
CTGCTGCGCC GCCTGGTGGA GATGCAGTAC TCCCGCAACG ACACCGCGTT CACGCGAGGC 
ACGTTCCGGG TGCGGGGCGA CACCATCGAG ATCATCCCGG TCTACGAGGA GCTGGCGATC 
CGCATCGAGA TGTTCGGTGA CGAGGTCGAG CGCCTGCTGA CCCTGCACCC GCTCACCGGC 
GAGGTGCTGG GCGAGAGCCG GGAGATGTTC ATCTTCCCCG CCTCGCACTA CGTGGCCGGC 
GAGGAGCGCA CCGAGCGGGC GATCGCCACC ATCGAGGCGG AACTGGGCGA GCGGCTGGCC 
GAGCTGGAGG CCCAGGGCAA GCTGCTGGAG GCGCAGCGCC TGCGCATGCG CACCACCCAC 
GACCTGGAGA TGATGCGCCA GCTGGGCACC TGCTCGGGCA TCGAGAACTA CTCCCGGCAC 
TTCGACGGCC GTGAGCCGGG CAGCCCGCCC AACACGCTCC TGGACTACTT CCCCGAGGAC 
TTCCTGCTGG TGCTGGACGA GTCCCACGTG ACCGTCCCGC AGATCGGCGC GATGTACGAG 
GGCGACGCCG CGCGCAAGCG CACCCTGGTC GAGCACGGGT TCCGGCTCCC CTCGGCGCTG 
GACAACCGGC CGCTGAAGTG GGAGGAGTTC ACCGAGCGCA TCGGGCAGAG CGTCTACCTG 
TCGGCGACGC CGGGCCGTTA CGAGCTGCGC CAGGGCGGCG GGGAGGTGGT CGAGCAGGTC 
ATCCGTCCCA CCGGGCTGGT GGACCCCGAG GTGCTGGTCA AGCCGACCGA CGGGCAGATC 
GACGACCTGG TCCACGAGAT CCGGGTGCGC GCCGAGCGCG ACGAGCGGGT ACTGGTCACC 
ACGCTCACCA AGAAGATGTC CGAGGACCTC ACCGACTACT TCACCGAACT CGGCATCCGG 
GTGCGCTACC TGCACAGCGA GGTGGACACG CTGCGCCGCG TGGAGCTGCT GCGCGAGCTG 
CGGGTGGGCG AGTTCGACGT GCTGGTGGGC ATCAACCTGC TGCGCGAGGG CCTGGACCTG 
CCCGAGGTGT CGTTGGTGGC GATCCTGGAC GCGGACAAGG AGGGCTTCCT GCGCTCGGAG 
ACCTCGCTGA TCCAGACGAT CGGGCGCGCG GCGCGCAACG TCGCGGGCCA GGTGCACATG 
TACGCCGACA ACGTCACCGA CTCCATGCGG GCGGCCATCG ACGAGACCAA CCGGCGCCGG 
GACAAGCAGC TGGCCTACAA CGCCGAGCAC GGGATCGACC CCACGCCGCT GCGCAAGCAG 
ATCGCCGACA TCCTGGACAC GCTCAACCGC GAGGACGTGG ACACCGAGGA GCTCATGGCC 
ACCGGGTACC GCAGTTCGGG GGGCAGGGGC GGCCGGGCGC CGGTGCCCGC GCTGGGCGAG 
CGTTCGGCGG ACGTGTCCGC CATGCCGCGC GCGGAGCTGG CCGGGCTCAT CGAGCAGCTG 
AGCGAGCAGA TGCACCAGGC GGCCACCGAC CTCCAGTTCG AGCTGGCGGC CCGGTTGCGC 
GACGAGATCG GCGAACTCAA ACGTGAGCTC CGCGGCATGG ACGCGGCCGG GGTGAAGTGA

Protein sequence

MRPVSDIKRS EAPFEVISEM TPAGDQPGAI AEISRRVRDG EPHTVLLGAT GTGKTATVAW 
TVEQLQRPTL VMQPNKTLAA QFANELRQML PNNAVEYFVS YYDYYQPEAY VPQSDTFIEK 
DSSINDEVER LRHSATNSLL TRRDTIVVAS VSCIYGLGTP QEYVDRMAQL AVGMEVDRDD 
LLRRLVEMQY SRNDTAFTRG TFRVRGDTIE IIPVYEELAI RIEMFGDEVE RLLTLHPLTG 
EVLGESREMF IFPASHYVAG EERTERAIAT IEAELGERLA ELEAQGKLLE AQRLRMRTTH 
DLEMMRQLGT CSGIENYSRH FDGREPGSPP NTLLDYFPED FLLVLDESHV TVPQIGAMYE 
GDAARKRTLV EHGFRLPSAL DNRPLKWEEF TERIGQSVYL SATPGRYELR QGGGEVVEQV 
IRPTGLVDPE VLVKPTDGQI DDLVHEIRVR AERDERVLVT TLTKKMSEDL TDYFTELGIR 
VRYLHSEVDT LRRVELLREL RVGEFDVLVG INLLREGLDL PEVSLVAILD ADKEGFLRSE 
TSLIQTIGRA ARNVAGQVHM YADNVTDSMR AAIDETNRRR DKQLAYNAEH GIDPTPLRKQ 
IADILDTLNR EDVDTEELMA TGYRSSGGRG GRAPVPALGE RSADVSAMPR AELAGLIEQL 
SEQMHQAATD LQFELAARLR DEIGELKREL RGMDAAGVK