Gene Ndas_3418 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3418
Symbol
ID	9247285
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	4088329
End bp	4090191
Gene Length	1863 bp
Protein Length	620 aa
Translation table	11
GC content	71%
IMG OID
Product	dihydroxy-acid dehydratase
Protein accession	YP_003681329
Protein GI	297562355
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAGCCC TACGCTCACG CACCGTCACC CACGGCAGGA ACATGGCCGG CGCGCGCGCC 
CTCATGCGCG CCACCGGTGT GGAGCGCGAG GACTTCGGCA AGCCCATCGT GGCCGTGGCC 
AACAGCTTCA CCGAGTTCGT GCCGGGCCAC GTCCACCTGC GCGAGGTGGC CGAGGTCGTC 
GCCAACGCCG TCCGCGAGGC GGGCGGCGTC CCCCGCGAGT TCAACTCCAT CGCCGTGGAC 
GACGGCATCG CCATGGGCCA CGGCGGCATG CTCTACTCCC TGCCCAGCCG CGAGCTGATC 
GCCGACTCGG TCGAGTACAT GGTCAACGCG CACTGCGCCG ACGCCCTGGT GTGCGTGTCC 
AACTGCGACA AGATCACCCC GGGCATGCTG CTGGCCGCGC TGCGCCTGAA CATCCCCACG 
GTGTTCGTCT CCGGCGGCCC CATGGAGGCG GGCAAGGTCA CGGTGGTCGA CGGCACCGCC 
ACCACCGTGC GCAAGCTGGA CCTGATCAAC CCGATGATCG CCGCGGCCGA CGAGAGCGTC 
TCCCAGGCCG AGCTGGACGA GATGGAGGAG GCCGCCTGCC CGACCTGCGG CTCCTGCTCG 
GGCATGTTCA CCGCCAACTC GATGAACTGC CTCACCGAGG CGATCGGCCT GGCCCTGCCC 
GGCAACGGCA CCGTGCTGGC CACCCACACC GCCCGCCGCG CCCTGTACGA GGACGCCGGA 
CGCCTGGTCG TGGAGGCCGC CAAGCGCTAC TACGAGGACG ACGACTCCTC CGTCCTGCCG 
CTGTCCATCG CCACCCCCGA GGCCTTCGGC AACGCCATGG CCCTGGACGT GGCCATGGGC 
GGCTCCACCA ACACGATCCT GCACCTGCTG GCCGCGGCCA CCGAGGCGGG CGTCGGCTTC 
GGCCTGCCCG AGATCGACGC GGTCTCGCGC CGGGTGCCGT GCCTGTGCAA GGTCGCGCCG 
AACACCGAGA AGTACCACAT CGAGGACGTG CACCGGGCGG GCGGCATCCC CTCCATCCTG 
GGCGAGCTGG CCCGCGGCGG CCTGCTGGAC ACCTCCCTGC CCACGGTGCA CGGCAAGACG 
GTCGGCGAGT TCATCGCCGA GTGGGACATC GTCTCCGACA CCGTCTCACC CGAGGCCGTG 
GAGCTGTTCC ACGCCGCCCC CGGCGGCAAG CGCACCACGA AGGCCTACTC ACAGGACACC 
CGCTGGGACA CCCTGGACAC CGACCGGGAG AAGGGCTGCA TCCGCTCAGT CGAGCACGCC 
TACACCAAGG ACGGCGGCCT GGCGGTGCTG TTCGGCAACC TCGCCCCGGA CGGCGCGATC 
GTCAAGACCG CGGGCGTGGA GGAGGAGCTG TGGACCTTCT CCGGACCGGC CAAGGTGTTC 
GAGTCCCAGG AGGACGCCGT GGACGGCATC CTCAACAAGC GGATCGAGCC CGGTGACGTG 
GTGGTCATCC GTTACGAGGG CCCCAAGGGC GGTCCGGGCA TGCAGGAGAT GCTGTACCCG 
ACGAGCTTCC TCAAGGGCCG CGGCCTGGGC AAGGCGTGCG CCCTCATCAC CGACGGCCGC 
TTCTCCGGCG GCACGTCGGG GCTGTCCATC GGCCACGCCT CCCCCGAGGC CGCCGCGGGC 
GGTGACATCG CGCTGGTGGA GGACGGCGAC GTCATCAGCA TCGACATCCC CAACCGGGGC 
ATCGTGCTGG AGGTCTCCGC GGAGGAGCTC GACGCGCGCC GCGAGCGCCT GCTCAAGGAG 
CTGGGCCGGT TCAGGCCGCG CGACCGACAG CGGCCGGTGA CCGCGGCTCT GCGCGCCTAC 
GCGGCCATGG CGACCTCGGC CTCGACCGGC GCCGCGCGCG ACGTGTCCCA GGTCGAGAAG 
TAG

Protein sequence

MPALRSRTVT HGRNMAGARA LMRATGVERE DFGKPIVAVA NSFTEFVPGH VHLREVAEVV 
ANAVREAGGV PREFNSIAVD DGIAMGHGGM LYSLPSRELI ADSVEYMVNA HCADALVCVS 
NCDKITPGML LAALRLNIPT VFVSGGPMEA GKVTVVDGTA TTVRKLDLIN PMIAAADESV 
SQAELDEMEE AACPTCGSCS GMFTANSMNC LTEAIGLALP GNGTVLATHT ARRALYEDAG 
RLVVEAAKRY YEDDDSSVLP LSIATPEAFG NAMALDVAMG GSTNTILHLL AAATEAGVGF 
GLPEIDAVSR RVPCLCKVAP NTEKYHIEDV HRAGGIPSIL GELARGGLLD TSLPTVHGKT 
VGEFIAEWDI VSDTVSPEAV ELFHAAPGGK RTTKAYSQDT RWDTLDTDRE KGCIRSVEHA 
YTKDGGLAVL FGNLAPDGAI VKTAGVEEEL WTFSGPAKVF ESQEDAVDGI LNKRIEPGDV 
VVIRYEGPKG GPGMQEMLYP TSFLKGRGLG KACALITDGR FSGGTSGLSI GHASPEAAAG 
GDIALVEDGD VISIDIPNRG IVLEVSAEEL DARRERLLKE LGRFRPRDRQ RPVTAALRAY 
AAMATSASTG AARDVSQVEK