Gene Ndas_0800 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_0800
Symbol
ID	9244645
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	984218
End bp	985780
Gene Length	1563 bp
Protein Length	520 aa
Translation table	11
GC content	74%
IMG OID
Product	polysaccharide deacetylase
Protein accession	YP_003678750
Protein GI	297559776
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.58232
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTGTCGT CGACTCGAGT CCACCCGAAC GAGGCCGCCC CCTGCCCCGG GGCCGGGGGG 
AACCGGCCGT GGGAACGCAG AGCCCGGTGG CCCGGGGCGG CGCTGGTCGC ACTGGTCCTG 
CCCCTGGCCG CGTGCGGCAC CGAGGGGATC GCCTCCGGGG GCGGTGAGGA CCCGGAACTG 
ATCACGGTGG TGGCGGCGGA GCCGGGGGAC GGGGTCACCG AGTGGCGCGG GGACGCCTCC 
GACTTCGAGG ACCACCCGTA CAAGCCCGAG GGGCTCACGA TCGACGTCGC CTACCCGGTG 
TTCTCGGGTG CCGACGCCTT CGCCGAGGAA CTGGCCGCCC GGGTGGACCA GGAGGTGCGG 
GACTACCGGG GCGCCAGCCG GGATCCGGTG AGTCTGGGCG TCGACTGGGA GGTGGTCGCC 
GCCGGGGACG GGGTGCTGGG CGTGCGCCTG GTGCGCACCG AGGAGGACTT CCACGGCCTG 
CGCCGGGGGT ACGGGACGTA CTGGTACGAC GCGTCCACCG GCCACACCGC CTACTCCACG 
GAGCTGCTGG CCGACGACGC GGCGCTCCGG GAGCTCAACG GGATCGTCCG CGCCTCGTTC 
GCCGACGAGG AGGCGGTGGA CGCGCGGGGG CTGCAACCGG TGATGCGCAC CTACGACTCG 
ATGGGGTTCA ACGGCGACGG GGACCTGGTG GTGGAGTTCG ACGACGGGCA CCTGTCCCCG 
ATCGTGGAGG GCCACCCCCC GTCCTCGGAG CCGGGGCGGA TGGTCGCGGT GGTGCCCGCC 
GAGGAGGCCG CGCCCCTGCT GTCCGGCCTG GGCGAGCGGG CGCGGGAGGC CGCCATGGCG 
GAGGAGCCCG TGCTGGCCGT GGAGGCCCCC GACGCCGAGC CCCCGGCCGA CCCGCCGGTG 
CCGGGGGCGG TCTCGGCGGG AGACCCCGAC CTGGACTGCG CCGGGGCCAA GTGCATCGCG 
CTGACCTTCG ACGACGGACC GGTGGCGACG ACTCCGCGGC TGCTGGACCT GCTGGCGGAG 
GAGGAGGTCG CGGCCACCTT CTTCCTCAAC GGCAACCCGG CGCTGACCCG GCCCAGCGTG 
ATCCGGCGCG CCTACGCCGA GGGGCACGAG ATCGGCAGCC ACAACCACCT GCACGAACGC 
ATGCCCGATG CCTTCGAGGG GGAGGAACTG GTCCACCAGG TGGCCGCGGT GAGCGCGATG 
GTGCGCCGCC AGACGGGCCA CACCGTGGAG CTGTTCCGGC CGCCGTTCGG CGACAGTTCA 
CCGGAGGTGC TGGGGGAGAT CGGCCGTCAG GGCATGGCCG AGATCCTGTG GAGCCAGGAC 
AGCAAGGACT GGACCGGCAT GAGCCGCGAC GAGGTCGTGG AGAGCGTGGT GGACGGCGCC 
CGCCCCGGGG GCGTGGTACT GCTGCACGAC ACCCTGGAGC CGACCCTGGC CGCGGTCCCG 
GAGATCATCG AGCGGCTGCG GGCCGACGGG TACGAGTTCG CGACCGTCAG CCAGGTCTAC 
GACGGCCCGG AGGCCGGGAA GAGCTACCCG CCCGAGGGGT TGTCCGCGCC CGCCGGTTCC 
TGA

Protein sequence

MLSSTRVHPN EAAPCPGAGG NRPWERRARW PGAALVALVL PLAACGTEGI ASGGGEDPEL 
ITVVAAEPGD GVTEWRGDAS DFEDHPYKPE GLTIDVAYPV FSGADAFAEE LAARVDQEVR 
DYRGASRDPV SLGVDWEVVA AGDGVLGVRL VRTEEDFHGL RRGYGTYWYD ASTGHTAYST 
ELLADDAALR ELNGIVRASF ADEEAVDARG LQPVMRTYDS MGFNGDGDLV VEFDDGHLSP 
IVEGHPPSSE PGRMVAVVPA EEAAPLLSGL GERAREAAMA EEPVLAVEAP DAEPPADPPV 
PGAVSAGDPD LDCAGAKCIA LTFDDGPVAT TPRLLDLLAE EEVAATFFLN GNPALTRPSV 
IRRAYAEGHE IGSHNHLHER MPDAFEGEEL VHQVAAVSAM VRRQTGHTVE LFRPPFGDSS 
PEVLGEIGRQ GMAEILWSQD SKDWTGMSRD EVVESVVDGA RPGGVVLLHD TLEPTLAAVP 
EIIERLRADG YEFATVSQVY DGPEAGKSYP PEGLSAPAGS