Gene Ndas_3623 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3623
Symbol
ID	9247492
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4344757
End bp	4345914
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	70%
IMG OID
Product	1-hydroxy-2-methyl-2-(E)-butenyl 4-diphosphate synthase
Protein accession	YP_003681529
Protein GI	297562555
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.772778
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGTCG ATCTCGGTAT TCCCGCCGCA CCGCCGCGCC CGCTGGCGAC CCGCCGCAAG 
ACGCGGCAGA TCATGGTCGG AAACGTCCCC GTCGGCGGGG ACGCCCCGGT GTCCGTGCAG 
TCGATGACGA CCACCCGTAC CTCCGACATC AACGCGACCC TCCAGCAGAT CGCGGAGCTG 
ACCGCCGCGG GCTGCCAGAT CGTCCGCGTG GCCGTGCCCA CCAACGACGA CGCCGACGCC 
CTGCCGATCA TCGCCAGGAA GTCGCAGATC CCGGTGATCG CCGACATCCA CTTCCAGCCC 
AAGTACGTGT TCCAGGCGAT CGACGCCGGA TGCGCCGCCG TGCGCGTCAA CCCGGGCAAC 
ATCAAGAAGT TCGACGACAA GGTCGCCGAG ATCGCCAAGG CGGCCGGTGA GGCCGGGACG 
CCGATCCGCA TCGGCGTCAA CGCCGGTTCG CTGGACAAGC GCCTGCTCCA GAAGTACGGC 
AAGGCCACGC CTGAGGCCCT GGTCGAGTCG GCTCTGTGGG AGTGCTCGCT GTTCGAGGAG 
CACGGCTTCC GCGACATCAA GATCTCGGTC AAGCACAACG ACCCCGTGGT CATGGTCAAC 
GCCTACCGCC AGCTCGCCGC GGCCTGCGAC TACCCGCTGC ACCTGGGCGT GACCGAGGCC 
GGTCCCGCCT TCCAGGGCAC CATCAAGTCC GCCGTGGCCT TCGGCGCTCT GCTCTCGGAG 
GGCATCGGCG ACACCATCCG CGTGTCCCTG TCCGCGCCCC CCGCGGAGGA GGTCAAGGTC 
GGCAACCAGA TCCTGGAGTC GCTCGGGCTG CGCGAGCGCG GCCTGGAGAT CGTCTCCTGC 
CCCAGCTGCG GCCGGGCCCA GGTGGACGTG TACACGCTCG CCGAGGAGGT CACCGCGGGT 
CTGGAGGGCA TGGAGGTGCC GCTGCGCGTG GCCGTCATGG GTTGCGTCGT CAACGGCCCC 
GGCGAGGCCC GCGACGCCGA CCTGGGCGTG GCCTCCGGCA ACGGCAAGGG CCAGATCTTC 
GTCAAGGGCG AGGTCATCAA GACCGTGCCC GAGTCCAAGA TCGTGGAGAC CCTCATCGAG 
GAGGCCATGC GCATCGCCGA GGAGATGGGC GAGTCCGGCG CCGAGTCGGG CGCGCCCACG 
GTCTCCGTGG CAGGCTGA

Protein sequence

MTVDLGIPAA PPRPLATRRK TRQIMVGNVP VGGDAPVSVQ SMTTTRTSDI NATLQQIAEL 
TAAGCQIVRV AVPTNDDADA LPIIARKSQI PVIADIHFQP KYVFQAIDAG CAAVRVNPGN 
IKKFDDKVAE IAKAAGEAGT PIRIGVNAGS LDKRLLQKYG KATPEALVES ALWECSLFEE 
HGFRDIKISV KHNDPVVMVN AYRQLAAACD YPLHLGVTEA GPAFQGTIKS AVAFGALLSE 
GIGDTIRVSL SAPPAEEVKV GNQILESLGL RERGLEIVSC PSCGRAQVDV YTLAEEVTAG 
LEGMEVPLRV AVMGCVVNGP GEARDADLGV ASGNGKGQIF VKGEVIKTVP ESKIVETLIE 
EAMRIAEEMG ESGAESGAPT VSVAG