Gene Ndas_5405 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5405
Symbol
ID	9249308
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	+
Start bp	583217
End bp	584806
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	71%
IMG OID
Product	Aldehyde Dehydrogenase
Protein accession	YP_003683290
Protein GI	297564317
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.264091
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGAAG AGTCTGATGA GACGAGGCTG TTTGTGACTA ACGATCCGGG GCAAACCGGA 
CCCGTGAACG AACTCTACGT AACCCTTCCG TCCGTGCCGT ACCTGGCGGA ACCGGGGTCG 
GCGACGGCCA CCAGCCTCTA CATCGACGGT CGGTGGCGGG CGGCCGGCAA CGGCCGGGTG 
CGGGAGATCC TGAACCCCGC CGACGCCTCC GTCCTGACCA TCGTCAGCGA GGGCGGAAGG 
GCCGACTCCG AGGAGGCCAT CGCCGCGGCC CGCCGCGCCT TCGACGGCGG CGAGTGGCCC 
CGCACCCCCG CCGGGGAGCG CGGACGCGTC CTCGACCGCA TCGCCGACCT GCTCCAGCGC 
GACCGCGAGG AGATCGCGGT CATGGAGTCC CTCGACACCG GCAAGACCAT CGAGGAGGGC 
GGGATCGACG TCGACGACGT CACCGGCGTC TTCCGCTACT ACGCCGGTCT CGCCGACAAG 
GACACGGGCC GCCTGGTCTC CGCGCCCGAG GGCGTGCACA GCAAGGTGGT CTACGAGCCC 
GTCGGCGTCT GCGGCATGAT CACGCCCTGG AACTACCCTC TGCTCCAGCT CGCCTGGAAG 
ATGGCCCCGG CCCTGGCCGC GGGCAACACC ATGGTGGTCA AGCCCAGTGA GATCACACCG 
GTCACCACCG CCAAGCTGGT CGAGCTCACT ACCGAGGCGG GCGTCCCGGC GGGCGTGGTC 
AACCTGGTCA CGGGCAGCGG CCCCGACGCG GGCGCCCCGC TGTCCGAGCA CCCCGACGTG 
GACCTGATCT CCTTCACCGG CGGTCTGGCC ACCGGCAGGC GGATCATGGC GGCGGCCTCC 
GAGACGGTCA AGAAGATCGC CCTGGAACTC GGCGGCAAGA ACCCCAACAT CATCTTCCCG 
GACGTGGACC TGGACACCGC CGTGGACTAC GCGCTCAGCG CCGCGTTCTT CCACTCCGGG 
CAGGTCTGCT CGGCCGGGGC GCGCCTCATC GTGCACAACG ACGTCCACGA CGCCTTCACC 
ACCGAACTCG CCCGCCGCGC CGAGGCCATC CGCATCGGCC GAGGCCAGGA CGAGGGCGTG 
CGCTGCGGCC CGCTGGTGTC GGCCGAGCAC CGCGCCAAGG TGGAGGCCGC GGTCGCTCGC 
GGCGTCGAGG AGGGCGCCCG GATCATCGCC GGGGGCAGGC GGCCCGACGA CCCGGACCTC 
GCGCAGGGCT ACTTCTACCG GCCCACCGTG TTCGTGGACT GCGACCGGGC CATGGACATC 
GTCCAGACCG AGGTGTTCGG CCCGGTCGTG ACCGTGGAGC GGTTCGAGAC CGAGCAGCAG 
GCCGTCGAGC TGGGCAACGA CACCGACTAC GGCCTCTCCG GCGGAGTGTG GACCGACGAC 
ACCGCCCGCG GGGAGCGCGT CGCGGCGGCC CTGCGCCACG GCACCGTCTG GATCAACGAC 
TACGGCCCCT ACTTCCCCGG CGCCGAGTGG GGCGGCTACG GCCGCAGCGG GATCGGCCGC 
GAACTCGGAC TCGCGGGCCT GGACGAGTAC CGCGAGGCCA AGCACGTCTA CCGCAACCTG 
TCCCCCGAAC CGCAGCGCTG GTTCGGCTGA

Protein sequence

MAEESDETRL FVTNDPGQTG PVNELYVTLP SVPYLAEPGS ATATSLYIDG RWRAAGNGRV 
REILNPADAS VLTIVSEGGR ADSEEAIAAA RRAFDGGEWP RTPAGERGRV LDRIADLLQR 
DREEIAVMES LDTGKTIEEG GIDVDDVTGV FRYYAGLADK DTGRLVSAPE GVHSKVVYEP 
VGVCGMITPW NYPLLQLAWK MAPALAAGNT MVVKPSEITP VTTAKLVELT TEAGVPAGVV 
NLVTGSGPDA GAPLSEHPDV DLISFTGGLA TGRRIMAAAS ETVKKIALEL GGKNPNIIFP 
DVDLDTAVDY ALSAAFFHSG QVCSAGARLI VHNDVHDAFT TELARRAEAI RIGRGQDEGV 
RCGPLVSAEH RAKVEAAVAR GVEEGARIIA GGRRPDDPDL AQGYFYRPTV FVDCDRAMDI 
VQTEVFGPVV TVERFETEQQ AVELGNDTDY GLSGGVWTDD TARGERVAAA LRHGTVWIND 
YGPYFPGAEW GGYGRSGIGR ELGLAGLDEY REAKHVYRNL SPEPQRWFG