Gene Ndas_1054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1054
Symbol
ID	9244900
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	1299113
End bp	1301080
Gene Length	1968 bp
Protein Length	655 aa
Translation table	11
GC content	72%
IMG OID
Product	Peptidyl-dipeptidase Dcp
Protein accession	YP_003679002
Protein GI	297560028
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.391003
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.428625
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGACCGACA ACCCGTTCCT GTCCCCGAGC GAGCTTCCCT ACCGGCTCCC CGACTTCGCG 
GCCATCCGCG AGGAGCACTT CCTGCCCGCG TTCGACAAGG GCGTGGCCGA GCACCTCGCC 
GAGGTGGACG CGATCGTCCG CGACCCGCGG CCCCCGACCT TCGACAACAC CATCGCGGCA 
CTGGAGCGCT CCGGCGCGCT CCTGGCCAGG GTGGAGACCG TCCTGCACAC CCTGGCCGGT 
TCCGACGCCA CCGACGGCAT CGAGGAGATC GAGCGGGAGA TCGCCCCGAG GGCCGCACAG 
CACCGGGACG CCATCTCGCT GAACCGGGAC CTGTGGGAGC GCGTGCGGCA GGTCACCGCC 
TCCGACCCGC AGGAGGCCTG GCTGCTGGAG CGGTACCGCC TCGACTTCGT CAAGGCGGGC 
GCCGACCTGG ACGACGACCA GCAGGCCCGG CTGCGCGAGC TCAACACCGA ACTCGCCGGA 
CTGAGCACCG AGTTCTCCCG CAACGTGGTC CGGGCCACCC GCGAGGCCTC CCTCGTCACC 
GGCGACGTCT CCGACCTCGA CGGCCTGGAC GAGGCGCACA TCAGCGCGAT CGAGCGGGAC 
GGGGAGTACG TCCTGCCCCT GCTCAACACC ACCGTGCAGC CCGCGCTGGC CCAGCTCACC 
AACCGCGCCA CCCGTGAGCG GCTCTACACC CTGAGCGCCG AGCGCGCCCC CGAGAACCTC 
GACATCGCCG CGCGCATGGC CGTCCTGCGC GCCGAGCGGG CCGCGCTGCT CGGCTACCCC 
GACCACGCGG CCTACACGGT CGCGGACCAG ACCGCCAAGA CCGTCGACGC GGTCGAGGAG 
CGGCTCGGCC AGCTCGTCGG ACCCGCCCGG CGCAACGTCG AGAAGGAGGC CCGGGCCCTG 
GCCGAGCACG CCGGGCACGA CATCGAGCCC TGGGACTGGC CCTTCTACGC CGAGCAGGTG 
CGCAGGGAGC GCTACGACTT CGACGACAGC GTCCTGCGCC CCTACTTCGA ACTCGGCAGG 
GTGGTCCGGG ACGGCGTCTT CCACGCCGCG ACGCTGCTGT ACGGGATCAC CTTCGCCGAG 
CGGCCCGACC TGCGCGGCTA CCACGAGGAC GTGCGGGTGT GGGAGGTGTT CGACCGGGAC 
GGCTCGCCCC TGGGGCTGTT CCTGCTGGAC CCCTACGCCA GACCGACCAA GCGCGGCGGC 
GCGTGGATGC ACAACCTGGT CGACCAGTCC TTCCTGCTGG ACGAGCGGCC GGTGGTGGTG 
AACAACCTCA ACATCACCAA GCCTGCCTCG GGCCCCACCC TGCTCACCTT CGACGAGGTC 
GAGACGGCCT TCCACGAGTT CGGCCACGCC CTGCACGGGC TGCTGTCGGC CGTGCGGTTC 
CCGCGCGTGC AGGGCACGAG CGTGCCGCGC GACTTCGTGG AGTTCCCCTC CCAGGTGAAC 
GAGATGTGGG CGACCTGGCC GGAGGTCCTG TCCCACTACG CCCGCCACCA CGAGACCGGT 
GAGCCGGTGC CCGCCGAACT CGTGGAGCGC CTGACGGCCG CCCGCCAGTT CAACCAGGGC 
TTCGCGACCT TCGAGTACCT GGCCGCGGCG CTCCTGGACT GGTCGTGGCA CCGCCTGGCC 
CCGGGCGAGG CCGTGGAGGA CCCGGCCTCC TTCGAGGCGC GCGCCCTGGA GGCGGCGGGG 
GCCCTGCACC CCCTGGTCCG TCCGCGCTAC CGGTCGGCGT ACTTCATGCA CGTGTTCGCC 
AACGGCTACA GCGCGGGCTA CTACTCCTAC GTGTGGAGCG AGGTCCTGGA CGCCGAGAGC 
GTGGAGTGGT TCACCGAGAA CGGCGGCCTC ACCCGGGAGG GCGGGGACCG CTTCCGGGAG 
AGGGTGCTGT CCGTGGGCGG CGGTGTGGAC CCCATGGAGG CGGTCCGCGA CTTCCTGGGC 
CGTGAGCCCC GGATGGAGCC CCTGCTGGTC CGCCGCGGGC TGGTCTGA

Protein sequence

MTDNPFLSPS ELPYRLPDFA AIREEHFLPA FDKGVAEHLA EVDAIVRDPR PPTFDNTIAA 
LERSGALLAR VETVLHTLAG SDATDGIEEI EREIAPRAAQ HRDAISLNRD LWERVRQVTA 
SDPQEAWLLE RYRLDFVKAG ADLDDDQQAR LRELNTELAG LSTEFSRNVV RATREASLVT 
GDVSDLDGLD EAHISAIERD GEYVLPLLNT TVQPALAQLT NRATRERLYT LSAERAPENL 
DIAARMAVLR AERAALLGYP DHAAYTVADQ TAKTVDAVEE RLGQLVGPAR RNVEKEARAL 
AEHAGHDIEP WDWPFYAEQV RRERYDFDDS VLRPYFELGR VVRDGVFHAA TLLYGITFAE 
RPDLRGYHED VRVWEVFDRD GSPLGLFLLD PYARPTKRGG AWMHNLVDQS FLLDERPVVV 
NNLNITKPAS GPTLLTFDEV ETAFHEFGHA LHGLLSAVRF PRVQGTSVPR DFVEFPSQVN 
EMWATWPEVL SHYARHHETG EPVPAELVER LTAARQFNQG FATFEYLAAA LLDWSWHRLA 
PGEAVEDPAS FEARALEAAG ALHPLVRPRY RSAYFMHVFA NGYSAGYYSY VWSEVLDAES 
VEWFTENGGL TREGGDRFRE RVLSVGGGVD PMEAVRDFLG REPRMEPLLV RRGLV