Gene Ndas_1446 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1446
Symbol
ID	9245296
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	1771575
End bp	1772708
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	78%
IMG OID
Product	Malate/L-lactate dehydrogenase
Protein accession	YP_003679384
Protein GI	297560410
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0751418
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCACCG CGGCCCCCAC CCAGGCCCCG CCGGAACGCG AGGCCGTACG GGTACGCCAC 
GACGACCTGG TCGCGTTCGC CGCCGGGGTG TTCACCGACC GCGGCCTGCC CCCCGACCGG 
GCGGCCGAGG CGGCGCGCGC TCTGTGCCAC GGCGACCTCG CCGGGCCGCG TTCGCACGGT 
CTGGCCAACC TGACCCGCCT CTACCTGCCG CTCCTCGACG AGGGCAGGGC CGACCCCGCC 
GCGGAGCCGC GCGTCCTCGC CGACCTCGGC GCCGCCGTGC TCTGGGACTC CCGGCGGGCC 
CTGGGCCTGT GGGCGGCGAG CGAGGCCATG GACCTGGCCG CCGAGCGCGC CGCGCGCCAC 
GGCATCGGGC TGGTGTCCGT GCGCGGCGCC ACCCACCTGG GCTGCGCCGG GTACCACGCG 
CTGCGCGCGG CCGAACGCGG CATGGTGGGC CTGGTGGCCA GCAACTGCGG ACGCCAGCGC 
ATCGCCCGCC CGCCCGGCGG CGCGGTCGCG ATGCTGGGCA CCAACCCGCT CAGCGTCGCC 
GCCCCGGCCG GGGAGCACCC GCCGTTCCTG CTCGACATGA GCACCACGGC CGCGCCCACC 
GGCCGGATCC GCCAGGCCGC CCGCGAGGGC CTCGCCCTGC CCGAAGGCCT GCTGTGCGAC 
GACACCGGCG CGCCCGTCAC CGACCCCGCC GCCTTCGACG CCGGGCGCGC GCACCTGATG 
TGGCTGGGCG GCGAAGCGGG ACGCTACAAG GGCTTCGGCC TCGGACTCAT GGTCGAGGTG 
CTCTCCGCAC TGGTCCCGGG GGCCGGGACG GGCCCCCACC CCGACGCCCT GGACGGGGAC 
GGCGGCCCGA GCGGACGCGA CGACGACATC GGCTTCTTCG TGGCCGCGAT CGCGCCCGGC 
GCCCTGCGGC AGGGCGCCGA CGACGACGCG CGGGAGCTGT TCGGCGCGCT GCTGGCCTGT 
CCGCCCACCG ACCCGGACGC GCCGGTGCGC TACCCCGGCT GGCACGAGTA CCACCGGGCG 
CGGGAACTGC GCCTGGCGGG CGTGCCGCTG GAGGCGGAGC TGTACGCCGA GCTGGCGGAG 
CTGGCCGACC GGACCGGCCT GCCCTTCGAG GCGATGCGGG AGGAGACGCG ATGA

Protein sequence

MTTAAPTQAP PEREAVRVRH DDLVAFAAGV FTDRGLPPDR AAEAARALCH GDLAGPRSHG 
LANLTRLYLP LLDEGRADPA AEPRVLADLG AAVLWDSRRA LGLWAASEAM DLAAERAARH 
GIGLVSVRGA THLGCAGYHA LRAAERGMVG LVASNCGRQR IARPPGGAVA MLGTNPLSVA 
APAGEHPPFL LDMSTTAAPT GRIRQAAREG LALPEGLLCD DTGAPVTDPA AFDAGRAHLM 
WLGGEAGRYK GFGLGLMVEV LSALVPGAGT GPHPDALDGD GGPSGRDDDI GFFVAAIAPG 
ALRQGADDDA RELFGALLAC PPTDPDAPVR YPGWHEYHRA RELRLAGVPL EAELYAELAE 
LADRTGLPFE AMREETR