Gene Ndas_1209 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1209
Symbol
ID	9245059
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	1470120
End bp	1471538
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	74%
IMG OID
Product	secretion protein snm4
Protein accession	YP_003679154
Protein GI	297560180
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGGGCC CCCACCGGAT GAACGATGTC GCCTCCCCGG ACCTGTGCCG ACTGCTGATC 
CGCGCCCCCG GGCGCTCCTT CGAGATCGCA GCGCCCACCG AGGTCCCCCT CTCCGAGATC 
CTGCCCACCC TGGTGCTCTA CGCCGAGGGT GACAACGGCG AGGACCTGGA CGAGAGCGGG 
CTGGAGCACG ACGGCTGGGT CCTCCAGCAA CTGGGCGACG AGCCCCTGGA GGAGGACGAG 
ACCCTCCGCT CCCTCGGACT CTGCCACGGA GAGACCCTCT ACCTGCGCCC CCGCCGCGAC 
CAGCTGCCGC CGGTGCACTT CGACGACCTC ACCGACGGCG TCGCCACCGG CATGGGCGAG 
CGCGCCGACC GGTGGCGCCC CGAGGCCACC CGCGTCCTGC TCCAGGCGCT GGGGCTGGTC 
GTGCTCTTCA CCGGTCTGGC GGTCCTGGTC AGCGGCGGCC CCGGCCTGCT GACCGCGGTG 
TCCGCCGCCT GCTCCTCCCT CCTCATGCTG CTGTCGGCCT GGGCGGCCTC GCGCGCCATG 
GGCGACCTGG CCGCCGCCAC CGGCCTGGCC GCGGCGGCCA CCCTGTACAT GGCGGTGGCC 
GGAGCCTCCG TGCCCTCGGG CGACCCCGGC ACCGCGCTGA CCGGAGCGAG GGTCCTGACC 
GGCGCGGTGA CCGCCGCCGG GGCCAGCGTG CTCGGCCTGG CGGCCGTGGC GGGCTCGGTG 
CCCTTCTTCG CGGGCCTGTT CACCGCCGAG GTGCTGTGCG CGCTGGGCGC GCTGTCCCTG 
ATGTTCATCC CCGGCGCCAC GGTCCCGGCC GTGGCGGCGC TGACGGCGCT CATCGCGTTG 
CTGCTGGGCA CGTTCGCCCC CCAGCTGGCC TTCCGCCTCT CCGGCCTCAA ACTGCCGCCC 
CTGCCCTCCA ACCCCGACCA GCTCCAGGAG GGCATCGACC CCTACCCCGC GCGCGGGGTC 
CTGGACCGCA CCGCGCTGGC CGACCGGTTC CAGACCGCCC TGTACGCCTC CACCGGCGCC 
GTCCTGACGG TCTGCCTGGT CGTGCTCGCC GCCTCCCCCG GGTGGGTGCC GATCACGCTG 
TGCGTCATCG TGTCGCTGGT GCTGCTGCTC CAGTCGCGCG GCCTGGCCAG CGCATGGCAG 
CGGTCCTTCG TGGTCGCGCC GCCCTGGATC GGGCTGACCG CGCTGGTCCT GGTCCTGGTG 
TGGACGGCCG ACCCCCTGCC CCGCACCCTC GCCATGGTGG GCCTGTTCGC CGCCTCCGCG 
ATCCTGGCGG TGGTGTCGTG GAACCTGCCG GGCACGCGGC CGCTGCCCCA CTGGGGCCGG 
GCCGCCGAGA TCATCCAGTC GCTGCTGACG GTGGCCATCG TGCCCCTGGT CCTGGCGATC 
TTCGGCGTGT TCTCGCTCCT GCGCGGAATC GGCGGCTGA

Protein sequence

MMGPHRMNDV ASPDLCRLLI RAPGRSFEIA APTEVPLSEI LPTLVLYAEG DNGEDLDESG 
LEHDGWVLQQ LGDEPLEEDE TLRSLGLCHG ETLYLRPRRD QLPPVHFDDL TDGVATGMGE 
RADRWRPEAT RVLLQALGLV VLFTGLAVLV SGGPGLLTAV SAACSSLLML LSAWAASRAM 
GDLAAATGLA AAATLYMAVA GASVPSGDPG TALTGARVLT GAVTAAGASV LGLAAVAGSV 
PFFAGLFTAE VLCALGALSL MFIPGATVPA VAALTALIAL LLGTFAPQLA FRLSGLKLPP 
LPSNPDQLQE GIDPYPARGV LDRTALADRF QTALYASTGA VLTVCLVVLA ASPGWVPITL 
CVIVSLVLLL QSRGLASAWQ RSFVVAPPWI GLTALVLVLV WTADPLPRTL AMVGLFAASA 
ILAVVSWNLP GTRPLPHWGR AAEIIQSLLT VAIVPLVLAI FGVFSLLRGI GG