Gene Ndas_5005 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5005
Symbol
ID	9248894
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	+
Start bp	147760
End bp	148950
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	73%
IMG OID
Product	Histone deacetylase
Protein accession	YP_003682892
Protein GI	297563919
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.983537
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAGGGC GCACGTCCTG CTCGCTTCGG GTGGCATGGG ACGACGGACT CACGGCCTAC 
GACTTCGGTC CGCAGCACCC GATGGCGCCG ATACGCGTCG AGCTGACCAT GGCGCTCAGC 
CGCGAACTCG GCGTGCTGGA CGCGCCGGGG GTCGGACTCC TGGACGTCGA ACCCGCCTCG 
GACGAACTCC TGTCCCTCGT GCACGACCCC GCCTACATCG AGGCGGTCAA GCGCGCGGGC 
CGCACGCTGG AGCCCGACGA CGCCCACATG CTGGGCACCT CCGACAACCC CGTCTTCAAG 
GACATGCACG ACGCCGCCGC GCTCATCTCC GGCGCGTCCG TGGCCGCCGC GCGGGCGGTC 
TGGAGCGGGG AGACCGCGCA CGCGGCCAAC ATCGCGGGCG GCCTGCACCA CGCCATGCGC 
GGCAACGCCT GGGGCTTCTG CGTCTACAAC GACCCCGCCC TGGCCATCGC CTGGCTGCTG 
GAGCAGGGGG CCAAGCGCGT CGCCTACGTG GACGTGGACG TCCACCACGG CGACGGCGTC 
CAGAACGCCT TCTACAACGA CCCGCGCGTG CTCACCATCA GCCTCCACGA GTCCCCGGCG 
ACCCTGTTCC CCGGCACCGG CCAGGCCTCC GAGACCGGCG GCCCGGACGC CGAGGGGTAC 
GCGGTCAACG TCGCCCTGCC CGCGGGCACC GGCGACAACG GCTGGCACCG CGCCTTCGAC 
GCCGTCGTGC CGCCGCTGCT GCACGAGTTC CAGCCCGAGA TCCTGGTGAC CCAGCAGGGC 
TGCGACACCC ACGCCCTGGA CCCGCTCGCC AACCTCACCC TGAGCGTGGA CGGCCAGCGC 
CGGGCCTACG CCGAGCTGCA CGAGCTGGCC CGCAAGACGG CGGGCGGCCG CTGGCTGCTG 
TTCGGCGGCG GCGGGTACGG GCTGGTCCAC GTCGTCCCCC GCGCCTGGAC CCACCTGCTG 
GGCGAGGCCG CGGGCCGTCC CATCGACCCC GACACCGAGA CCCCGCAGGG CTGGCGCGAC 
TTCGTGCGCC AGCGCACGGG GGAGCTGGCG CCGCTGTACA TGACCGACGG GCGCGAGGTC 
GTCTTCGACC ACTTCGTGGA CGGCTACGAC CCGGGCGACC CGGTGGACCG GGCCATCCAC 
GCGACCCGGA CCGCGGTCTT CCCCAGCCAC GGGATCGACC CGAGCCTGTA G

Protein sequence

MGGRTSCSLR VAWDDGLTAY DFGPQHPMAP IRVELTMALS RELGVLDAPG VGLLDVEPAS 
DELLSLVHDP AYIEAVKRAG RTLEPDDAHM LGTSDNPVFK DMHDAAALIS GASVAAARAV 
WSGETAHAAN IAGGLHHAMR GNAWGFCVYN DPALAIAWLL EQGAKRVAYV DVDVHHGDGV 
QNAFYNDPRV LTISLHESPA TLFPGTGQAS ETGGPDAEGY AVNVALPAGT GDNGWHRAFD 
AVVPPLLHEF QPEILVTQQG CDTHALDPLA NLTLSVDGQR RAYAELHELA RKTAGGRWLL 
FGGGGYGLVH VVPRAWTHLL GEAAGRPIDP DTETPQGWRD FVRQRTGELA PLYMTDGREV 
VFDHFVDGYD PGDPVDRAIH ATRTAVFPSH GIDPSL