Gene Ndas_2498 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2498
Symbol
ID	9246348
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	2960986
End bp	2962635
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	77%
IMG OID
Product	Aldehyde Dehydrogenase
Protein accession	YP_003680423
Protein GI	297561449
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGAGC ACACTCCGGA CCCGAAGGGC ACGAACACGG GCACGGCCGC GGACGTCCTC 
GGACCGCTGG TGGCCTGCGC TCCCGTCGAG GGCGGGGCCG GGACCCTGCG CGCGACCGAC 
CCCGCCACGG GGGAGGAGTT CGGCGAGCCC GTGGGCCTGG TGGACTCCGG CCAGATCCAG 
GAGGCCACCC GCGCCGCCGA GCAGGCCCTG GACGCCTTCC GCGCCCAGTC GCCAGCCGAG 
CGCGCCGACT TCCTGCGCCG CGTCGCCGAC AACATCGACG CCCTGGGCGA CGCGCTCGTG 
GACCGGGCGG TGCGCGAGAG CGGCCTGCCG CGCCAGCGCC TGACGGGGGA GCGGGCCCGC 
ACCACCGGCC AGCTGCGCAT GTTCGCCGAC GTCGTGGCCC AGGGCGACGC CCTGGGCGCC 
CGCATCGACC CGGCGCTGCC CGACCGCACC CCCCAGCCCC GCCCCGACCT GCGCCTGGCG 
CACATCCCCG TCGGCCCCGT GGTGGTCTTC GGCGCGAGCA ACTTCCCCCT GGCCTTCTCC 
ACCGCCGGGG GCGACACGGC CGCGGCCCTG GCCGCCGGGT GCCCGGTGAT CGTCAAGGGC 
CACAACGCCC ACCCCGGCAC CGCCGCGCTG GTCGGGCGCG CCGTGGCCGA CGCGGTGCGC 
GAGAGCGGCC TGCCCGGCGG CGTGTTCTCC CTGTTGTTCG GGGAGGGCAA CGGCATCGGA 
CAGGAGCTGG TCGCCGACCC GCGCGTGAAG GCCGTGGCCT TCACCGGGTC GCGGGGCGGC 
GGGCTGGCCC TGATGCGGGT GGCGGCCGAG CGCCCCGAGC CGATCCCGGT CTTCGCCGAG 
ATGTCCTCGG TCAACCCCGT GTTCGTGCTG CCCGGCGCGC TCGCCGGGCA GGGCGCCCAG 
GACCTGGCCG GGGCCTACGT CGCCTCGCTC ACCCTGGGAT CGGGGCAGTT CTGCACCAAC 
CCCGGGCTGG TGTTCGTCCC CTCCACCCCG GACGGGGACC GGTTCGTGGA AGCCGCCGCG 
CGCCTGGTGG CCGACGCCAC CGGCCAGACG ATGCTCACCG CGCCCATCGC CGCGGCCTTC 
CGCGACGGGG TGGAGGCGCT GGAGGGGCGT TCGGAGGTCG TGCTGCGGGC CAGGGGCGGC 
GAGGGGGAGG GCCCCAACGC GCCGGCCCCG GCCCTGGCCG AGGTGTCCCT GGCCGACCTC 
ACGGCCGACC CGCGCCTGAG CGAGGAGGTC TTCGGCGCCG CGGGCACGGT GGTGCGCTAC 
CCCGACGCCG CCGCGCTGCC CGCCGCGCTG GAGGGGCTGG AGGGCCAGCT CACCGCGACC 
CTGCACGCCG ACACCGGCGA CGCCGACGAC CTGGCGGCGG CGCGCGCCCT GCTGCCGGTG 
CTGGAGCGCC GCGCGGGCCG CGTCCTGTTC GGGGGCTGGC CCACTGGGGT GGAGGTGACC 
CACGCGATGG TCCACGGCGG CCCCTTCCCC GCCACCTCCG ACGGCCGGGG CACCTCGGTG 
GGCAGCCTGG CCCTGCACCG GTTCCTGCGG CCGGTCAGCT ACCAGGACAT GCCCGACGCC 
CTGCTGCCGC CCGCACTGCG CCAGGACAAC CCCTGGCGGC TGAACCGACG AGTCGAGGGC 
ACCGTCGTGC CCGGAGGAGA CCCCGCATGA

Protein sequence

MAEHTPDPKG TNTGTAADVL GPLVACAPVE GGAGTLRATD PATGEEFGEP VGLVDSGQIQ 
EATRAAEQAL DAFRAQSPAE RADFLRRVAD NIDALGDALV DRAVRESGLP RQRLTGERAR 
TTGQLRMFAD VVAQGDALGA RIDPALPDRT PQPRPDLRLA HIPVGPVVVF GASNFPLAFS 
TAGGDTAAAL AAGCPVIVKG HNAHPGTAAL VGRAVADAVR ESGLPGGVFS LLFGEGNGIG 
QELVADPRVK AVAFTGSRGG GLALMRVAAE RPEPIPVFAE MSSVNPVFVL PGALAGQGAQ 
DLAGAYVASL TLGSGQFCTN PGLVFVPSTP DGDRFVEAAA RLVADATGQT MLTAPIAAAF 
RDGVEALEGR SEVVLRARGG EGEGPNAPAP ALAEVSLADL TADPRLSEEV FGAAGTVVRY 
PDAAALPAAL EGLEGQLTAT LHADTGDADD LAAARALLPV LERRAGRVLF GGWPTGVEVT 
HAMVHGGPFP ATSDGRGTSV GSLALHRFLR PVSYQDMPDA LLPPALRQDN PWRLNRRVEG 
TVVPGGDPA