Gene Namu_4387 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4387
Symbol	ispH
ID	8450013
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4869937
End bp	4870917
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	70%
IMG OID	645043434
Product	4-hydroxy-3-methylbut-2-enyl diphosphate reductase
Protein accession	YP_003203663
Protein GI	258654507
COG category	[I] Lipid transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0761] Penicillin tolerance protein
TIGRFAM ID	[TIGR00216] (E)-4-hydroxy-3-methyl-but-2-enyl pyrophosphate reductase (IPP and DMAPP forming)

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCCC CGACCTCTTC GCCCGCCAAG CGCGTCCTGC TGGCCAGCCC GCGCGGCTAC 
TGCGCGGGGG TCGACCGCGC GGTCGTCACC GTCGAGAAGG CCCTGGAGCA GTACGGGCCG 
CCGGTGTACG TGCGCAAGCA GATCGTGCAC AACAAGCACG TGGTGGCCAC CCTGGAGTCC 
CGCGGGGCGA TCTTCGTGGA GGAGACCGAC GAGGTCCCGG AGGGTGAGAT CGTCGTCTTC 
TCGGCGCACG GGGTGTCCCC GGCCGTGCAC GAGCAGGCCG CGCGCCGGCA GCTGCAGGTG 
ATCGACGCGA CCTGCCCGCT GGTCACCAAG GTGCACAAGG AGGCCCGGCG GTTCGCCGCC 
GAGGACTACG ACATCCTGCT CATCGGCCAT CGCGGGCACG AGGAGGTCGA GGGCACCCAC 
GGGGAGGCGC CCGAGGCGAT CCAGCTGATC AACGATGCCT CCGACGTCGA TGCGGTGACC 
GTGCGCGACC CGGAAAAGGT GATCTGGCTC TCGCAGACCA CGCTGTCGGT GGATGAGACA 
TTGGGCACCG TCGATCTGCT TCGCAAGCGC TTCCCGCTGA TGACCTCGCC GCCCAGCGAC 
GACATCTGTT ACGCCACCCA GAACCGGCAG GAAGTGGTCA AGCAGATCGC CGCGGACTGC 
GACCTGGTGA TCGTGGTCGG GTCGACGAAC TCGTCCAACT CGGTGCGGCT GGTCGAGGTG 
GCGCTGGGAG CCGGGGCCGA TACCGCCTAC CTGGTCGACG ACGCCGGCGA GATCGACGAG 
GCCTGGCTGG ACGGGGTGCA CACCGTCGGG GTGACCAGTG GGGCCTCGGT GCCCGACGAC 
CTGGTTGAAG GAGTGCTGGC CCACCTGCAG GAACGGGGCT TTCCGCCGGC CGAGGAGTTC 
ACCGCGGCGA CCGAGACGCT GACGTTCTCG CTGCCCAAGG AACTGCGCCG GCCGGCGGCC 
TCCACTCGCG GGGGCAGCTG A

Protein sequence

MTAPTSSPAK RVLLASPRGY CAGVDRAVVT VEKALEQYGP PVYVRKQIVH NKHVVATLES 
RGAIFVEETD EVPEGEIVVF SAHGVSPAVH EQAARRQLQV IDATCPLVTK VHKEARRFAA 
EDYDILLIGH RGHEEVEGTH GEAPEAIQLI NDASDVDAVT VRDPEKVIWL SQTTLSVDET 
LGTVDLLRKR FPLMTSPPSD DICYATQNRQ EVVKQIAADC DLVIVVGSTN SSNSVRLVEV 
ALGAGADTAY LVDDAGEIDE AWLDGVHTVG VTSGASVPDD LVEGVLAHLQ ERGFPPAEEF 
TAATETLTFS LPKELRRPAA STRGGS