Gene Ndas_4617 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4617
Symbol
ID	9248498
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	5483862
End bp	5485187
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	75%
IMG OID
Product	secretion protein snm4
Protein accession	YP_003682509
Protein GI	297563535
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.245929
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.704968
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCTT GGAGCCGCGT GACCCTCGTC GGCGAGGAGC GCAGGGTCGA CGCCGTCCTG 
CCCGCGAGCG AACCCGTGGG CGCGCTCATG CCCGAGGTGC TCGACCTCCT CGGCGACCAG 
GTGGAGAACC CCGCCAAACT GCGGCACCTG GTGACCGCCT CCGGGATCGT CCTGGAGGGC 
GACACCACGC TCGCGGAACG GCAGATCACC GACGGCGCGG TGCTGCGGCT GGTCCGGGCG 
GAGGAACCGG TGCCCGCCCC GGTGGTGCAC GAGGTCCCCG AGGCGGTCTC GATGGCCCTG 
GACGACCACC AGGGGCGCTG GAACCCGGTG GCGGCCCGCT GGACCGCCAC CGTCTCCCTC 
GTCGCCCTCG CCGTGGGCGC GGCCTGGATC GTGCAGGGGT ACTTCTCCGG CAACGGCGGC 
CTCGTCGGCC TGGCCGTGGT CGCCGCCGTG CTGGTTGCGG TGGGCGCGTC GATCGGCCCG 
ACCTGGCGGG AGCCCCTGGG CACGGCCCTG GCGATCAGCG GCACCGCGGT CGGCGGACTG 
GTCCTGTGGC TGGCCTGCGA CCAGCTCGGC TGGCCCGAGT GGGCCCGCTG GGGCGGCGGC 
GCCGCCCTGG TCGCGGGACT GGTCCTGCTG CTCGGGCTCA CGTCGGGACT GGGCCGGGGC 
GGCCTGACCG GTGGCGGGGT CGGACTCGCC CTGGCGGTCG TGTGGTCGGT GGGCGCGGCG 
CTGGGCCTGC CCACCTACCA GATCGCCGTC ATCATGGCGG TGGCCTGCGT GGTGCTGCTG 
AGCCTGCTGC TCCGCCTGGC GCTGATGTTC TCCGGGCTGG CGGTCCTGGA CGACCGGCGC 
AGCTCCGGGG AGGCGGTGAC CCGGAGCGAC GTGCTCACCT CGGTGGCGGG AGCCCACCGG 
AGCCTGGTGA TCGCCACGAT CGCGGTGGCG GTGTCCGCGG CCACGGCGGG GATCGGCCTG 
GCCACCCACT TCGACTGGTG GACGGCGGGG CTGTCGGTGG TGCTGGCCCT GGTGGTGGCC 
AGCCGCGCCC GGCTGTTCCC GCTGGTCGCG CAGAAGTCGG TGCTCATCGC CGCGAGCCTC 
GTGGTGCTGG TGGCCTTCCT CCTCTCCTGG GCCGAGGCCG TGCCCTGGGG GGTGTGGCCC 
GCGCTGGGGA TCGCGGTCGC GGTGTCGGCC GTCCCCGCGG TCGTGCTGTC GATCGAGCAG 
CCCGAGCACG TGCGGGCGCG GCTGCGCGGT GTCACCAGCA GGTTCGAGGC GGTCGCCGTC 
GTCGTGCTGG TGCCCCTGGC GATCGGCGCG TTCGGCACCT TCCAGCGCCT CCTCACGACC 
TTCTGA

Protein sequence

MTAWSRVTLV GEERRVDAVL PASEPVGALM PEVLDLLGDQ VENPAKLRHL VTASGIVLEG 
DTTLAERQIT DGAVLRLVRA EEPVPAPVVH EVPEAVSMAL DDHQGRWNPV AARWTATVSL 
VALAVGAAWI VQGYFSGNGG LVGLAVVAAV LVAVGASIGP TWREPLGTAL AISGTAVGGL 
VLWLACDQLG WPEWARWGGG AALVAGLVLL LGLTSGLGRG GLTGGGVGLA LAVVWSVGAA 
LGLPTYQIAV IMAVACVVLL SLLLRLALMF SGLAVLDDRR SSGEAVTRSD VLTSVAGAHR 
SLVIATIAVA VSAATAGIGL ATHFDWWTAG LSVVLALVVA SRARLFPLVA QKSVLIAASL 
VVLVAFLLSW AEAVPWGVWP ALGIAVAVSA VPAVVLSIEQ PEHVRARLRG VTSRFEAVAV 
VVLVPLAIGA FGTFQRLLTT F