Gene Ndas_3906 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3906
Symbol
ID	9247777
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	4678365
End bp	4679441
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	75%
IMG OID
Product	peptidase M50
Protein accession	YP_003681809
Protein GI	297562835
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGCGC CCGAGCCGCC GCGCAAGGCG GAGACGACCG ACGTGCCCGA GGCCGGCGGG 
GCAGTCGCCG ACCCGTGGGA GCAGATGCCC GAGGACGCCC TCAACCGGCC GGACCTGGGG 
GAGGACACCG GGGGCCCCGG CAGGGCCGGG GACTCCGGGA CCGGCGCCCG GCCGCTGGAC 
GCCGCGGGGA CGAAGGACGC GGGACCCGCG TCCGCGCGCC CGGACGCCTC CGGGGACGCC 
GACCCGGACG CCTCCCGGGG CGGCCCCGAC GCCGCGCGCT CCGGGAGCTG GGCGGACTTC 
CTGCCCAGCC CGGTGTTCGT GCTGCTGCTG GGCCTGGCGG GGTTCGCGGG CTGGCTGTCG 
TGGACCGCCG CGGAGCTGGA GTGGGCCGCC GAGGGCACCA GCGTCACCCC GCTGGTCCCG 
CCGCTGTTCA TCCTGCTCTG CTGGATCGTC TCCCTGGCCG TGCACGAGTT CGCGCACGCG 
CTCGCCGCCT ACCTGGCCGG TGACCGCTCC CTGCGCGGCA GCGCCTACCT GCGGCTCAAC 
CCGTTCGCCT ACCGGCATGC CTTCGCCGGG CTGGTCCTGC CCTCGGCCTA CCTGGGCCTG 
GGCGCCTTCG GCATGACCGG TCCGCCCACC TACGTGGACT GGGACCGCAT CCCGTCCCGG 
GGCCGCCGCG TCCTGGTGGC ACTCGCCGGA CCGCTGGCCA GCCTCCTGGT GGCCGCCGCG 
TTCGCGGTCA CCGTGTCCGT TCTGGTCCCC CCGGGCAACG ACACCACCAA CTGGGCGATC 
TCGGCGATGG CCTTCCTGTG CTTCGCGAAC CTGACGGCCG CCCTGATCAA CCTGCTGCCC 
GTCCCCGGCC TGGACGGCTT CGAGGTGCTG GCCGCCTGGA CGCGCGGGAA GTGGGTCACC 
GCGGCCCGCG ACAACGCGCT GTTCGGCTCG GTGGCCGTGT TCGCGGTCCT GTGGTTCCCG 
GGCCTGAACG ACCTGCTGGT GAACGCGGTG TACGGCCTGT TCGACCTGGT GCTGCCCAAC 
CCGGTGTTCC GCGGCATCGC CTTCTACGGC GAGCTGCTCC TCCAGTTCTG GGCCTGA

Protein sequence

MPAPEPPRKA ETTDVPEAGG AVADPWEQMP EDALNRPDLG EDTGGPGRAG DSGTGARPLD 
AAGTKDAGPA SARPDASGDA DPDASRGGPD AARSGSWADF LPSPVFVLLL GLAGFAGWLS 
WTAAELEWAA EGTSVTPLVP PLFILLCWIV SLAVHEFAHA LAAYLAGDRS LRGSAYLRLN 
PFAYRHAFAG LVLPSAYLGL GAFGMTGPPT YVDWDRIPSR GRRVLVALAG PLASLLVAAA 
FAVTVSVLVP PGNDTTNWAI SAMAFLCFAN LTAALINLLP VPGLDGFEVL AAWTRGKWVT 
AARDNALFGS VAVFAVLWFP GLNDLLVNAV YGLFDLVLPN PVFRGIAFYG ELLLQFWA