Gene Ndas_0028 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0028
Symbol
ID	9243855
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	36038
End bp	37195
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	75%
IMG OID
Product	peptidase M20
Protein accession	YP_003677986
Protein GI	297559012
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.36117
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAGA CGGTGACCGC GAGGTTGGCG GACGCGGCTG AGCGCGCCCT GCCCGGCATG 
ATCGACGACC TGCGCGCCCT GGTGGAGCTG GAGACCCCCA GCGGCGACAG GGACCTGCTG 
TCCGCCGGAC TGGACGGCAT CGAGGGGTGG CTGGCCCGGC GGCTGGGCGC GCCCGAGACC 
CGGGTCCGCT ACGACGGCGG CTCCTTCGGC GACGTGCTGG AGGTGTCCTA TCCCGGTACG 
GGGGCGGGGA CCGTGCTCTT CGTCAGCCAC TACGACACCG TCTGGCCCGC CGGAACCCTG 
GCCGGGTGGC CCGTCACGGT CGAGGGCGAC CGGTTCAGCG GCCCCGGCTG CTTCGACATG 
AAGGCCGGGA TCGTGCAGAG CGCCTGGGCT CTGCGGCTCC TGCGCGAACT GGACCTGCCC 
CGGCCCGCCG TGCGGATGCT GCTCACCGGG GACGAGGAGA TCGGCAGCCC CGCGTCGCGC 
CCGCACATCG AGCGGGCCAG CGAGGGCGTG GACCTGACCC TGGTCCTCGA ACCCAGCCGG 
GAGGGCATGC CCAAGACCCG ACGCAAGGGC ATGGGGATCT TCGACGTGGA CGTGCGCGGC 
GTGGAGTCCC ACGCGGGCCT GGACCCCGCA GCGGGGGCGA GCGCCGTGCA CGCCCTGGCC 
CAGGTCGTGC CCGCGCTCAC CGCCCTGTCC GCGCCGGAGC TGGGCACCAC GGTGAACGTG 
GGCCTGGTCT CCGGGGGGAC CGGGTACAAC GTCGTCGCCG GGCACGCCCG CTGCGGGGTG 
GACGTGCGGG TGCAGGACCC CGCCGAGATG GCCCGCGTGG ACGCCGGGCT GGCCGCGCTC 
GCCGCCGCCG ACCCGCGCGT GGCGGTCCGG GTCACCGGCG GGTGGAACCG CCCTCCGATG 
AACCCCAACC CGCCCTCGGA GAAGGCGTTC GGCCTGCTGC GCGAGGTGGC CGGGGAACTG 
GGCGCCTCCC TGGAGGAGGT GTCGGTGGGC GGGGCCAGCG ACGCCAACTT CGTCTCCGCG 
CTGGGCCGCC CGGTGCTCGA CGGGCTGGGC GCGGTGGGCG CCGGACCGCA TTCGCGCGAC 
GAGCACGTCC TGGTCGGCGG GACGCCGCGC CAGGTCGCCC TGGTGGCGGG CCTGATGGAG 
CGGATCGCGG GGAGGTAG

Protein sequence

MSQTVTARLA DAAERALPGM IDDLRALVEL ETPSGDRDLL SAGLDGIEGW LARRLGAPET 
RVRYDGGSFG DVLEVSYPGT GAGTVLFVSH YDTVWPAGTL AGWPVTVEGD RFSGPGCFDM 
KAGIVQSAWA LRLLRELDLP RPAVRMLLTG DEEIGSPASR PHIERASEGV DLTLVLEPSR 
EGMPKTRRKG MGIFDVDVRG VESHAGLDPA AGASAVHALA QVVPALTALS APELGTTVNV 
GLVSGGTGYN VVAGHARCGV DVRVQDPAEM ARVDAGLAAL AAADPRVAVR VTGGWNRPPM 
NPNPPSEKAF GLLREVAGEL GASLEEVSVG GASDANFVSA LGRPVLDGLG AVGAGPHSRD 
EHVLVGGTPR QVALVAGLME RIAGR