Gene Ndas_0859 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0859
Symbol
ID	9244704
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	1055275
End bp	1056336
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	73%
IMG OID
Product	phosphoesterase PA-phosphatase related protein
Protein accession	YP_003678809
Protein GI	297559835
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0242811
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGCGT TGCCAGGCGC GGACCCCTGG GAGTACGCGT TGAACGCTTG GACCGCCGAG 
CACCTGGCCA CGGACGCGCT GTGGGAGGCG GAGACCGCCC CCATCCTCTG GCTCCAGGGC 
CTGGGGGACT GGCTCGCCTA CCCGCTGGGC CTGGTCACCC ACCTGGGTTC CCACACGCTC 
GTCATCCTCG CCCTCACCCT GGTCTTCTGG TGCGTCAACC CCGGCCTGGG GGCGCGCCTG 
TTCGTCGTGG TGGCCTGCTC AGGCGTGGTC AACCAGCTGT TCAAGTCCCT GCTCTACGGG 
GCCCGGCCGC CCTGGTTCGA CGCCCGCGTC ACGGCCCACA CGAGTTCGGA CAGCTTCGGG 
ATCCCCTCCG GGCACACCCA GGGCGCCACC GTCACCTGGG GCTACCTCGG CATCAGGTCC 
GGCCGCCGCG CCGTGCTGTG GGCGGCGGTC GCGGTCATCG CGCTCGTCTC GCTCTCGCGG 
GTCTACCTGG GCGCCCACTT CATCAGCGAC GTCGTGGCCG GGCTGGTGCT GGGCGCCGCC 
CTGCTGTGGG CGGTCCTGCG CTGGGAGGAT CGCGTCACCG CCTGGTGGCT GGGGCTGGGC 
ACGGCCCGCT GGGTGGGCTA CGCCCTGGCC GTCGCCCTGC TGCCCTGCCT GGCGGCCACC 
CTGTGGCAGC TGCTGGTGCG CGGTGACTGG ACGGTCCCCC AGGAGTGGAT CGGCGCGGTC 
CCCGCCGACC CGGCCGCCGA AACCCTCACC GGCCTGTACA CCGTGGCCGG GACACTGCTG 
GGCGGGCTGG TGGGCTTCAC CCTGCTCGCC CGGCGCGGAT GGTACAGCGC CTCGGGCACC 
CTGGCCTCCC GGGCCGCCCG TTTCGTCCTG GGGGTCTCGG TGATCGTGCT GGTGCAGGTG 
TTCGTGAGCG TGCTCTTCGG CCACCTGGGC GGGCTCGCCA ACGCCGCCGT GTCCTTCGCC 
GCCTACGGCG CTATCACCTT CTGGGCCTCC TTCCTGGCCC CGGAGGCCTT CGTCCGCAGC 
GGCCTGGCCA CCCGGCCCGG GGCCGCCGCC GAGACCTCCT GA

Protein sequence

MSALPGADPW EYALNAWTAE HLATDALWEA ETAPILWLQG LGDWLAYPLG LVTHLGSHTL 
VILALTLVFW CVNPGLGARL FVVVACSGVV NQLFKSLLYG ARPPWFDARV TAHTSSDSFG 
IPSGHTQGAT VTWGYLGIRS GRRAVLWAAV AVIALVSLSR VYLGAHFISD VVAGLVLGAA 
LLWAVLRWED RVTAWWLGLG TARWVGYALA VALLPCLAAT LWQLLVRGDW TVPQEWIGAV 
PADPAAETLT GLYTVAGTLL GGLVGFTLLA RRGWYSASGT LASRAARFVL GVSVIVLVQV 
FVSVLFGHLG GLANAAVSFA AYGAITFWAS FLAPEAFVRS GLATRPGAAA ETS