Gene Ndas_4092 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4092
Symbol
ID	9247965
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4889127
End bp	4890233
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	70%
IMG OID
Product	peptidase M15B and M15C DD-carboxypeptidase VanY/endolysin
Protein accession	YP_003681994
Protein GI	297563020
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.240127
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGTTCA CTTCTGATGC GGCGCGGCGC AGGTCCCGCG TACCGGGTGG CGGCGGGGCG 
CTCACCGCCT TCGCCCTGTC CTACCGGGTC CGCTTCGCAC AGGCGCTGAC GCTCACGCTC 
GTCACCGCGC TCCTCGTGGC GCCGGTGCAC ACCGGCGCGC TGGAACCCGC CGAGGCGAGC 
CTGGAGGAGT TCCGGGAGAG GGCCGAGACC GCCTCCCAGG AGCTGGAGGA GGCCAACCAG 
GACCTCGTCG ACCGCCAGGA CGCGCTGGAG GACGCCCAGT CGGAGCTGGT CCAGACCATC 
TACGACCTCC AGCAGACCGA ACTCGAACTC AACGAGATGC GCGAACCGCT GGCCCAGCTG 
GCCAGCACGC TGTACAAGCA GCCCGACGGC GGCATGCTCG CCGTCCTGGC GTCGGGGTCC 
CTCACCGAGG ACCTGCAGAT CCAGTCCTAC GCGGCGAAGA TCTCCGAGGA CAACCAGATG 
CTCATCCAGG ACGCCACGGA CCTGCGTGAG GAGCAGGTCG AGCTGGCGAG CCAGGCGCAG 
GAGCTCCAGA CCACCACCCA GCTCGAACAG GTCGAGCTGG CCGCGGACAT CGAGGCCCTG 
CGCGAGCGGT CCGAGCAGAC CACGAACGAG CTGGTGCAGG AGCTGGAGGA CCGCGGCATC 
GACCCGGAGG CCTACATGGC CGCCGGGGAC TGCGACCCGT CCGCCGCCGC GAACGCCGAG 
GGGGCGGCCA ACGGCCTGCT CCCGGCCAAC TCCCTGTGCG ACCTCTACGA CGACAAGAAG 
CTGCGCGCCG ACGCGGCCGT GGACTTCCTC CAGCTCAACG CCAGGTACGT GGACGAGTTC 
GGCGAGAACA TCTGCATCAC CAGCGCCTAC CGCGACCTGC CCAACCAGCA CCGCGTCTAC 
GGACAGGTCG CGCCGGGCTT CGCGGCCGTC CCCGGCACGA GCAACCACGG CCTGGGACAG 
GCCATCGACC TCGGCTGCGG CATCCAGAAC TACCGGTCCG ACCGCTGGCT CTGGATGGAG 
GCCAACGGCG CCGACTTCGG CTGGCACCAC CCTGCCTGGG CCAAGTCCAG TCCCTTCGAG 
CCCTGGCACT GGGAGTACAC CGGCTGA

Protein sequence

MPFTSDAARR RSRVPGGGGA LTAFALSYRV RFAQALTLTL VTALLVAPVH TGALEPAEAS 
LEEFRERAET ASQELEEANQ DLVDRQDALE DAQSELVQTI YDLQQTELEL NEMREPLAQL 
ASTLYKQPDG GMLAVLASGS LTEDLQIQSY AAKISEDNQM LIQDATDLRE EQVELASQAQ 
ELQTTTQLEQ VELAADIEAL RERSEQTTNE LVQELEDRGI DPEAYMAAGD CDPSAAANAE 
GAANGLLPAN SLCDLYDDKK LRADAAVDFL QLNARYVDEF GENICITSAY RDLPNQHRVY 
GQVAPGFAAV PGTSNHGLGQ AIDLGCGIQN YRSDRWLWME ANGADFGWHH PAWAKSSPFE 
PWHWEYTG