Gene Ndas_1930 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1930
Symbol
ID	9245780
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	2350963
End bp	2352405
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	73%
IMG OID
Product	Aldehyde Dehydrogenase
Protein accession	YP_003679863
Protein GI	297560889
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.68692
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACA CCCAAGGCGC CCCCGCCGCC GAGGCCGCCC CCCGGCCCCC CGCCGAGCCG 
CTCACCCTGA CCACCGAGAT CCCACCGGTG GTCGCCCGCC TGCGCGCCGC CTTCGCCTCC 
GGCCGCACCA AGCCCGTCGC CTGGCGCCGC GCCCAGCTGC GCGCGCTGCG CCGCATGCTC 
ACCGAGGAGC GCACCGCGTT CGAACGCGTG CTCAAGGCCG ACCTCGGCAA GAGCCCCATC 
GAGGCCCACA CCACCGAGAT CGGCTTCGTG GTCAACGAGA TCGACCACAC CCTCAGGCAC 
CTGGCCTCCT GGCTGCGCCC GCAGCGGGTG CCCGTGCCCG TCGCCCTGGC CCCGGCCAGG 
GCCCGCCGCG TGCGCGAGCC GCTGGGCACC GTGCTGATCA TCGCCCCGTG GAACTACCCG 
GTGAACCTGT CCCTGGCGCC CCTGGTCGGT GCCCTCGCCG CGGGCAACGC CGCCCTGGTC 
AAGCCCAGCG AACTGGCCCC GGCCACCTCC GCCGCCCTGG CCGAGCTGCT GCCCCGCTAC 
CTGGACACCG AGGCGGTCGC GGTCGTGGAG GGCGGCATCC CCGAGAGCAC CGCCCTGCTC 
GATGAGCGCT TCGACCACAT CTTCTACACC GGCAACGGCA CCGTGGCCCG CATCGTCATG 
GCCGCCGCCG CCAAGCACCT GACCCCCGTC ACCCTGGAGC TGGGCGGCAA GAGCCCGGCC 
ATCGTCGAAC CCGGGGTGGA CCTGGCCACC ACCGCCCGCC GCCTGGCCTG GGGCAAGTTC 
ACCAACACCG GTCAGACCTG CGTGGCCCCC GACTACGTGC TCGCCGTCGG CGACACCGCC 
GAACCGCTCC AGCGCGAGCT GACCGCCGCC ATCACCGAGA TGTTCGGCGA GGACCCCTCA 
CGCAGCGCCG ACTACGGGCG CATCGTCAAC GAGCGCCACT TCGCCCGGAT CACCGCCCTG 
CTGGGCAGCG GCACCGTGGT CACCGGCGGA CAGCACGACA TCGACCGCCT CTACGTCGCC 
CCCACCGTCC TGGCCGACGT GGACCCCGAC TCCCCGGTGA TGTCGGAGGA GATCTTCGGC 
CCCGTCCTGC CGGTCCTGCG GGTCCCCGAC CTGGACGCGG CCATCGCCTT CGTCAACGCA 
CGCGACAAGC CGCTGGCGCT GTACGGCTTC ACCGACTCCG AGGAGACCAA GCGCCGCCTG 
ACCACCGAGA CCTCCTCGGG CGGCCTGGCC TTCGGTCTGC CGATCGCCCA CCTGGCCGTT 
CCCGACCTGC CCTTCGGCGG CGTGGGGGAC AGCGGTATGG GCGCCTACCA CTCCGCGGCC 
TCCCTGGACA CCTTCTCGCA CACCAAGTCG GTGCTGGACA AGTCGCTGTT CATGGACACC 
ATGCGCATCG CCTACGCGCC CGTCACCGAC CTCAAGCAGA AGCTGCTCCG CCGGCTCCTG 
TGA

Protein sequence

MTDTQGAPAA EAAPRPPAEP LTLTTEIPPV VARLRAAFAS GRTKPVAWRR AQLRALRRML 
TEERTAFERV LKADLGKSPI EAHTTEIGFV VNEIDHTLRH LASWLRPQRV PVPVALAPAR 
ARRVREPLGT VLIIAPWNYP VNLSLAPLVG ALAAGNAALV KPSELAPATS AALAELLPRY 
LDTEAVAVVE GGIPESTALL DERFDHIFYT GNGTVARIVM AAAAKHLTPV TLELGGKSPA 
IVEPGVDLAT TARRLAWGKF TNTGQTCVAP DYVLAVGDTA EPLQRELTAA ITEMFGEDPS 
RSADYGRIVN ERHFARITAL LGSGTVVTGG QHDIDRLYVA PTVLADVDPD SPVMSEEIFG 
PVLPVLRVPD LDAAIAFVNA RDKPLALYGF TDSEETKRRL TTETSSGGLA FGLPIAHLAV 
PDLPFGGVGD SGMGAYHSAA SLDTFSHTKS VLDKSLFMDT MRIAYAPVTD LKQKLLRRLL