Gene Ndas_2846 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2846
Symbol
ID	9246697
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	3396127
End bp	3397680
Gene Length	1554 bp
Protein Length	517 aa
Translation table	11
GC content	77%
IMG OID
Product	protein of unknown function zinc metallopeptidase putative
Protein accession	YP_003680763
Protein GI	297561789
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAGAACC CATCCGGCGG TGAGCGGCCC GGAGGCGAGA CCCCCAGACC CGAGCGGTCC 
GGTACCGGAG GCGCCGTCTG CGGCCCCGGT GCCGAGGAGG CCACCGGACC CCGGGCGGAC 
GGACGGGAAC ACGGCGAGGC GGAGCAGGGG CGGGACGGAG CCCCCTCCGC GCCCGTTCCC 
CCGCACCCCG GACCGACCGC GGACAGCACA CTCCGCGTGC CCACCGCCCC GCACCCCGGA 
CCGACCGCGG ACGGCACGCC CCCCATGCCC GCTCCCCCGC ACTCCGGACC GGGCGCGGAC 
AGCACGCCCT CCGCCCCGGC GGCCCCGCAC GCGGAGCGGA CGGGGAACAC CGCCCGACAC 
CCCGCTCCCC CACGCCCCGG ACCGGGCGCG GGCGCCCCGC CGTACCGCGC CGCTCCTCCC 
TCCCCGGGGG CGACACAGGC CGGTGCGCCG TACGGCCCCG TTCTCCCCGC CGCCCTCTAC 
GGCCACCCCG TCCACCCGGG CGCCGGGTAC GGCCCGCCCG TCACCGGCCC CGTCCCCGCG 
CCGCACCCCT GGCGGGCACC GGCCGCCTAC ACGCATCCCC ACCCCTTCGC CCTCCCGCCC 
GGCGGACACC CCGCCGCCCA CCCGGGGACG GGCTGGCAGC CGCCCGCGCC GCCCTGGACG 
CAGCCGCCGG GACGGCCCTC GCGCCGCGGT GGCGCGAGCG TGCTGCTCGG TTCGGCGAGC 
GCGGCCGCGA TCGCCCTCGT GGCGCTGGCC GCGAGCATCC TCATCGTCGC CACCACCCCC 
CAGGAGGAGC CCCAGCCCAC CGGCGTCGAC CTGTCCGCCC ACTACGACGA CCGCCTCAGG 
GCGCGGCCCA ACCAGGTGGA GGTCGACGTC GTCGACCACC CCCTCTACGA CGTCGCCATG 
CCCGCACCGG TCGACTGCGA CGTCCCCGAG CTGGACATGG ACTCCGACGA GTCCTGGGAG 
GAGTTCGCGT CCGTCTCCGG GGAGTGCCTG AACAGGCTGT GGGAGCCGGT GTTCGAGGAC 
CTGGGCGTGT CCGTGGAGCT GCCCGAGTTC GCCGTCACCC GGACCTCTCC CGACCCCCCC 
GACGCCAGCC CGGAGGACGG GTACACGCTC GCCTACTACG AGAGCGACCT GAGCCGCGTC 
ACCGTCGTGC TGCCCAACGT GCGCCACCTG GGCGCCCTGC TCCCCCCGGA CGAGCGCGAG 
GAGGTCTGGC TCGCCCTGAT GGGCCACGAG TACGGCCACC ACGTGCAGTA CGCCACCGGC 
ATCCTGGGCG TCGCGCACGG CATGACCTGG AAGGCCGAGA ACGAACAGGC CGAACTGGAG 
GCGCTGCGCC GCACCGAGCT CCAGGCCGAG TGCATGGCCG GGGTGGGCCT GCGCGGGATC 
ACCGGCGCCG ACGAGGAGGC GCTGCGCACG GCCAACGAGC ACTTCAACGC CGGAGGCGAC 
CTGGACACGC ACGGCAGCGC GGGCAACCGG GCGTTCTGGC TGGAACAGGG CTGGTCGCAG 
GCGACCGTGG AGGGCTGCAA CACCTACGGC GCCGCCACCG ACCAGGTCGC CTGA

Protein sequence

MENPSGGERP GGETPRPERS GTGGAVCGPG AEEATGPRAD GREHGEAEQG RDGAPSAPVP 
PHPGPTADST LRVPTAPHPG PTADGTPPMP APPHSGPGAD STPSAPAAPH AERTGNTARH 
PAPPRPGPGA GAPPYRAAPP SPGATQAGAP YGPVLPAALY GHPVHPGAGY GPPVTGPVPA 
PHPWRAPAAY THPHPFALPP GGHPAAHPGT GWQPPAPPWT QPPGRPSRRG GASVLLGSAS 
AAAIALVALA ASILIVATTP QEEPQPTGVD LSAHYDDRLR ARPNQVEVDV VDHPLYDVAM 
PAPVDCDVPE LDMDSDESWE EFASVSGECL NRLWEPVFED LGVSVELPEF AVTRTSPDPP 
DASPEDGYTL AYYESDLSRV TVVLPNVRHL GALLPPDERE EVWLALMGHE YGHHVQYATG 
ILGVAHGMTW KAENEQAELE ALRRTELQAE CMAGVGLRGI TGADEEALRT ANEHFNAGGD 
LDTHGSAGNR AFWLEQGWSQ ATVEGCNTYG AATDQVA