Gene Ndas_0033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0033
Symbol
ID	9243860
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	43204
End bp	44301
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	77%
IMG OID
Product	hypothetical protein
Protein accession	YP_003677991
Protein GI	297559017
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.661509
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.260394
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACCGTA ACCCCGCCAG CCGCGGCTCG CGCGGCGACA CCGAAGCCGT GCGCGGGATG 
CTCGCCGCGC ACGACCCCGC GGCCTCCGTC CGCCCCGACC CCGCGGCCCG CGACCTCACT 
AGGATCGAGG CGATCGCCTC GGGCGACCGC CTCCGGGGCC GCGGCCTGAC CCCCCGGCGC 
ACCGCCCCGC GCCTGGCGCT GGGCGCCGCC GCCGCGTTCA CCGCCGTGGC AGTGCTCGGA 
ACCCTGGGCT GGAACTCCGT CCAGCCCGCG TACGCCGGTC CGCCCCCCGC GCCGCTGGAG 
GTCCCCCTGG CCGCCGACGC GCCCGCGGGC CGCGAGCACC TCCTCGCCCT GGCGGAGGCC 
GCCGAGGAGC AGCCCCCGCC GCCCGCCGGG GGAGAAGTCG CCTACGTGCA CACCGCGGAG 
TGGACTCTCA CCTACTCCCA GGACGCCGAC ACCGGCGAGG CGGGCTGGGG CGTCCTGCCG 
ACGGACGAGC AGGTCTGGCG CACCCCGCAC CGGTCCGGGC GCAGCGTCTC CACCCCGAGC 
CTGCCCGAGC ACGGGGGCGG TGACCCCGCC CCGCTCCGGT GGCTCTTCGA GAGCGGGCCC 
GAGGAGTTCG AGTGGGGCGG CGGCGAGGGC GGGAACGGCA TGTTCTTCAC CTTGGAGCCC 
GACAGCCTCT CCGCGGACCC GGACCAGCTC GCCGAGCAGC TCCTGGCGGT CGGCGGCCGG 
GCCTCCGGGG CCACGCGGGA CCCCTCCCCC GCGGTCGGGC TCGTGTACGC CCTCCAGTTG 
CTGTACGAGG AGGCCCCGGT CGGCCCCGAC GTGCAGGCCG CCGCGCTGCG CGCGCTCGCC 
GGGCAGGAGG ACGTGCGGTA CGCGGGCACG GCCAGGGACC GCGAAGGGCG CGAGGGCGAG 
CTGTTCCTGG TCGAGGAGGA CGCCGGGGAC GGCATCGTCC TGGAGCGCAG GATCATGTTC 
GACGCCGACA CGGGCACGCC GCTCTACCAC GAGACGGTCG CCGTGGAGTC GCCCGGGGAG 
GAGGGGCTGC CGAGGGTGAA CAACTACACC GTGCTGGTGG AGACCGCCTG GGTGGCGGAG 
GTCGGCGCCG CCCCCTGA

Protein sequence

MNRNPASRGS RGDTEAVRGM LAAHDPAASV RPDPAARDLT RIEAIASGDR LRGRGLTPRR 
TAPRLALGAA AAFTAVAVLG TLGWNSVQPA YAGPPPAPLE VPLAADAPAG REHLLALAEA 
AEEQPPPPAG GEVAYVHTAE WTLTYSQDAD TGEAGWGVLP TDEQVWRTPH RSGRSVSTPS 
LPEHGGGDPA PLRWLFESGP EEFEWGGGEG GNGMFFTLEP DSLSADPDQL AEQLLAVGGR 
ASGATRDPSP AVGLVYALQL LYEEAPVGPD VQAAALRALA GQEDVRYAGT ARDREGREGE 
LFLVEEDAGD GIVLERRIMF DADTGTPLYH ETVAVESPGE EGLPRVNNYT VLVETAWVAE 
VGAAP