Gene Ndas_1337 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1337
Symbol
ID	9245187
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	1643732
End bp	1645192
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	73%
IMG OID
Product	Aldehyde dehydrogenase (NAD(+))
Protein accession	YP_003679275
Protein GI	297560301
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGACCA ACGACTACAC GAACATGTTC TACGTGAACG GGCGCTGGAT CCGCTCGCAC 
GGTACGCGGC AGGTCGTGGT GACCAACCCG GCCACCGAGG AGAGCCTGGG CCGGGTGACT 
CTGGGCGACG TCACCGACGT CGAGGCGGTG GTCGACGCCG CCCGCCGGGC CGCGCCCGGC 
TGGGCCGGGA CGCCCGTGTC CGAGCGCGCG GCGCTGCTGC GCGCCGTCGC GGCCGAGCTG 
GCCCTGCGCC AGGAGGAGAT CGCGCGGTTG GAGACGGCGG AGGTCGGTTC CCCGATCACC 
CTGTCCCGCC GGGCGCACGC GCAGAGCCCG ATCCACCTCT TCGCCTCGGC CGCCGACCTG 
GTCGAGCGGT CCGAGCCGGA CGAGACGATC CCCGGCGCGA CGGTGCTGCG CGAACCGTAC 
GGTGTGGTCG GCGCGATCAC CCCGTGGAAC TACCCGCTGC ACCAGAGCGC GGCCAAGATA 
GCCCCGGCGC TGGCGGCCGG GAACACCGTC GTGCACAAGC CCAGTGAGAC CACGCCGCTG 
GGGGCCTACG CCCTGGCCGA GGCGATCGAA TCGGCGGGGC TGCCGCCCGG CGTGTTCAAC 
ATGGTCATGG GTGACGGGGC GACCGTCGGA GCGCGCGTCG CCGGTCACCC CGACGTCGAC 
CTCGTCTCGT TCACCGGTTC CACCCGGGCC GGGGTCCGGG TGGCGGCTGA GGCGGCGGCC 
ACCGTCAAGA AGGTCTCCCT GGAACTGGGC GGCAAGAGCC CCGCCGTCAT CCTGCCGGGC 
GCGCCGCTGC GCCCGGCCGT GCGGCGGGCA CTGCGCTCGG GTTTCCTCAA CTCCGGCCAG 
ACGTGCATGG CCCTGACCCG GATCCTCGTC GACCGGGCGC GCCTGGCCGA GGCCGAGGAG 
ATCGTCCGCG ACGCGGTCGC CGACTACGTC GTGGGCGACC CGACCGACCC GGACACCGAG 
TACGGTCCGC TCGTCTCGAA GGCGCAGCGG GACCGCGTGC GCGACTACGT CCGCAGGGGG 
CAGCGGGAGG GCCTGCGCCT GATCACCGGT GGTCCCGACC GCCCGGCCGC GTTGAGCCGC 
GGCTACTACC TGCCGCTGAC GGTCTTCTCC GACGTCCCGC CCACCTCGGC GCTGGTGACC 
GACGAGATCT TCGGGCCCGT GCTGGTGATC CAGGTCTACG ACTCGGTGGG CGAGGCCGTC 
GATCTGGCCA ACCGCACGCC CTACGGCCTG TGCGCCGGGG TGTGGGGCGC CGACCGCGCC 
GAGGCCGTCG AGGTGGCGGG GCGGTTGCAG GTCGGCCAGG TCTTCGTCAA CGGCGCCGGG 
TTCAATCCGG ACGTCCCGTT CGGCGGCTTC AAGCGGTCGG GGATCGGCCG CGAGTACGGG 
CGCTACGGGC TGGAGGAGTT CCAGCAGACC AAGGGGCTGG TGTTCGGCGC CGACGCTGTC 
GGCTGTGGTG GATACCGCTG A

Protein sequence

MQTNDYTNMF YVNGRWIRSH GTRQVVVTNP ATEESLGRVT LGDVTDVEAV VDAARRAAPG 
WAGTPVSERA ALLRAVAAEL ALRQEEIARL ETAEVGSPIT LSRRAHAQSP IHLFASAADL 
VERSEPDETI PGATVLREPY GVVGAITPWN YPLHQSAAKI APALAAGNTV VHKPSETTPL 
GAYALAEAIE SAGLPPGVFN MVMGDGATVG ARVAGHPDVD LVSFTGSTRA GVRVAAEAAA 
TVKKVSLELG GKSPAVILPG APLRPAVRRA LRSGFLNSGQ TCMALTRILV DRARLAEAEE 
IVRDAVADYV VGDPTDPDTE YGPLVSKAQR DRVRDYVRRG QREGLRLITG GPDRPAALSR 
GYYLPLTVFS DVPPTSALVT DEIFGPVLVI QVYDSVGEAV DLANRTPYGL CAGVWGADRA 
EAVEVAGRLQ VGQVFVNGAG FNPDVPFGGF KRSGIGREYG RYGLEEFQQT KGLVFGADAV 
GCGGYR