Gene Ndas_5346 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5346
Symbol
ID	9249249
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	+
Start bp	521447
End bp	522904
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	76%
IMG OID
Product	Aldehyde Dehydrogenase
Protein accession	YP_003683232
Protein GI	297564259
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0811797
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACCG CCCCGGACAC CACGCCGGAG GAACTCGACG CCGTGATGGA ACGGGCCGCC 
GCGGCGGCGC CGCTCCTGGC CGCGCTCACC CCGGGCGAGC GCGCCGGGCT GCTGCGCGCC 
GTCGCCGACG CCCTGGACGG CGCGGCCGAC GAGCTCGTGC CGATCGCGAT GGAGGAGGCG 
CACTACCCCG AGGCGCGCTG CCGGGGGGAG CTGGGCCGCA CCACCTTCCA GCTGCGCCTG 
TTCGCCGAGA CCCTGGAGGA GGGCTCCTAC CTGGAGGCCG CCGTGGACCC GGCCGACCCC 
GACTGGGGCA CCCCGCGCCC GGACGTGCGC CGCCTGCTGG TCCCGCTGGG GCCGGTGGTG 
GTGTTCGGGG CGAGCAACTT CCCGTTCGCG TTCGCCACGG CCGGAGGCGA CAGCGCCTCC 
GCCCTGGCCG CCGGATGCCC CGTGGTCGTC AAGGCCCACC CCGGGCACCT CCGGCTCGCC 
CGGCGCACCG CGGAGATCGT GGTCGCGGCG CTCGACGGCG TCGGGGCGCC CGAGGGCGGT 
TTCGCCCTGG TCGAGGGGGT GGAGACGGGC AAACGCGCGG TCACCCACCC GCTCACCCGG 
GCCGTGGGCT TCACCGGGTC CATCCCCGGC GGGCGGGCCC TGTTCGACCT GGCGGTCTCG 
CGACCGGACC CGATCCCCTT CTACGGGGAG CTCGGCAGCG TGAACCCGGT GTTCGTCACC 
CGCGCTGCCG CCGCTGCGCG CGGCGACGAG ATCCTGGGCG GGTACGCGGA CTCGGCCACC 
ATGGGCTCGG GCCAGTTCTG TACCAAGCCC GGCGTGCTGT TCGTGCCGGA GGAGACCAAG 
CTCGACGCCC TCGTCGCCGA CTTCGGCGGG CGCGCCGCCG CCCCGCTGCT CAACGAGCGG 
GTCTCCGAGG GCTTCGTGCG CGGGCTGGAC GCCCTGAGCG CCCACCCGGC CACCGAGGTG 
CTGGTCCAGG GCGTGCGCAC CGGTGACGAC TGGACCCCGT CCCTGCTGCG CACCGACCTG 
GACTCCCTGC TGGAGAACGC CGAGACCCTC CTGGAGGAGT GCTTCGGCCC GGCGACGCTC 
GTGGTCACCT ACCCCGACGA GCGGCGGCTG CTGGAGGCGG CCGGGGTGTT CGGCGGCCAG 
CTCACCGTGA CCGTGCACGG CGAGGAGGAC GACGAGATCG CGCCCGCGCT GCTGGCGCTG 
GGCGCGTCCC TGGCCGGACG GGTGCTCTGG AACAGCTGGC CTACCGGGGT GGCGGTCACC 
CACGCCATGA CCCACGGCGG CCCCTACCCG GCCACCACCG CGCCGCTGCA CACGTCGGTG 
GGCACCACGG CGGTCCGTCG CTTCCTGCGC CCGGTCACCT ACCAGTCGGT GCCGCAGTCG 
CTGCTGCCCC GGGAGCTGCG CGACGACAAC CCGCTGGGCG TGCCGCGCCG CGTGAACGGC 
GCCGCTCCCT CCGCCTGA

Protein sequence

MTTAPDTTPE ELDAVMERAA AAAPLLAALT PGERAGLLRA VADALDGAAD ELVPIAMEEA 
HYPEARCRGE LGRTTFQLRL FAETLEEGSY LEAAVDPADP DWGTPRPDVR RLLVPLGPVV 
VFGASNFPFA FATAGGDSAS ALAAGCPVVV KAHPGHLRLA RRTAEIVVAA LDGVGAPEGG 
FALVEGVETG KRAVTHPLTR AVGFTGSIPG GRALFDLAVS RPDPIPFYGE LGSVNPVFVT 
RAAAAARGDE ILGGYADSAT MGSGQFCTKP GVLFVPEETK LDALVADFGG RAAAPLLNER 
VSEGFVRGLD ALSAHPATEV LVQGVRTGDD WTPSLLRTDL DSLLENAETL LEECFGPATL 
VVTYPDERRL LEAAGVFGGQ LTVTVHGEED DEIAPALLAL GASLAGRVLW NSWPTGVAVT 
HAMTHGGPYP ATTAPLHTSV GTTAVRRFLR PVTYQSVPQS LLPRELRDDN PLGVPRRVNG 
AAPSA