Gene Dvul_1724 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_1724
Symbol	ispG
ID	4663016
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	-
Start bp	2035324
End bp	2036484
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	63%
IMG OID	639819963
Product	4-hydroxy-3-methylbut-2-en-1-yl diphosphate synthase
Protein accession	YP_967168
Protein GI	120602768
COG category	[I] Lipid transport and metabolism
COG ID	[COG0821] Enzyme involved in the deoxyxylulose pathway of isoprenoid biosynthesis
TIGRFAM ID	[TIGR00612] 1-hydroxy-2-methyl-2-(E)-butenyl 4-diphosphate synthase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.694346
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.709473
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTGGCT TGCTGGGTGA AATGCAGTAT GTACCCGGCA TCCATTCACC CAATGAAGGA 
CCGCGCCCCA TGACCATCCA ACGCAAGCAG ACCCGCGAGG TGCGCATAGG CAAGGTGCGT 
ATCGGCGGTG CCAATCCCGT TGTCGTGCAG AGCATGACCA ACACCGACAC GCGGGACGTC 
GAGCAGACTG TCGAGCAGAT ACGCCAATTG CAGGAAGCCG GCTGCGAGAT CGTACGTCTC 
GCCGTCCTCA ACGAGGACGC GGCATGGGCC ATCAAGCCCA TCCGGTCGCA GGTTTCCGTA 
CCGCTGGTCG CTGACATCCA TTTCGACCAC AGGCTCGCCG TCTCCGCCCT CGAGGCGGGT 
GTGGACGCCC TGCGCATCAA CCCCGGCAAC ATCGGAACGA GGGCTGCGGT CGACCGCGTG 
GTGGACGCCG CCAAGGCCCA TAACGCCGTC ATCCGCATCG GCGTGAACTC GGGCTCGCTG 
GAGACCGACC TCATCGACCA GTATGGCGGG CCCACTCCCG AAGCCATGGT GGAGAGTGCG 
TTCCGTCACA TCAGGATGCT CGAGGATCGC AATTTCGGCG ACATCAAAGT CTCGCTCAAA 
TCCTCGTCCG TGTCGCGTTG TATCGAAGCG TATACGCTGC TTTCCGCGAA GTGCGACTAC 
CCGCTGCATA TCGGCGTCAC TGAAGCCGGT ACGGTGCTGC GTGGTTCCAT CAAGTCTGCT 
GTCGGGCTCG GTGTCCTGCT GTGGCAGGGC ATCGGCGATA CCCTGCGGGT GTCGCTCACC 
AGCGACCCCG TGGCCGAGAT GGCGGTGGCG TGGGAGATAC TCCGCTCACT CGGGTTGCGC 
TCGCGGGGGC CTGAGATCAT CGCCTGTCCC ACCTGTGGTC GCTGTGAGAT AGGACTCATC 
GCCCTCGCGG AAGAGGTCGA GCGACGTCTC GAAGGCGAGA CGGAGAGCTT CAAGGTGGCG 
GTGATGGGGT GTGTGGTCAA TGGCCCCGGA GAGGCGCGCG AGGCCGACCT CGGCATCGCG 
GGCGGGCGCG ACAAGGGCAT CATCTTCCGC AAGGGTGAGA TTGTGCGCAC CGTCAAGGGC 
GGCTCGAACC TGCTTGCCGC CTTCATGGAA GAACTCGACA CTTTTCTGGC CCACCGCAGG 
GCCGAACGTA AGGATGACTG A

Protein sequence

MLGLLGEMQY VPGIHSPNEG PRPMTIQRKQ TREVRIGKVR IGGANPVVVQ SMTNTDTRDV 
EQTVEQIRQL QEAGCEIVRL AVLNEDAAWA IKPIRSQVSV PLVADIHFDH RLAVSALEAG 
VDALRINPGN IGTRAAVDRV VDAAKAHNAV IRIGVNSGSL ETDLIDQYGG PTPEAMVESA 
FRHIRMLEDR NFGDIKVSLK SSSVSRCIEA YTLLSAKCDY PLHIGVTEAG TVLRGSIKSA 
VGLGVLLWQG IGDTLRVSLT SDPVAEMAVA WEILRSLGLR SRGPEIIACP TCGRCEIGLI 
ALAEEVERRL EGETESFKVA VMGCVVNGPG EAREADLGIA GGRDKGIIFR KGEIVRTVKG 
GSNLLAAFME ELDTFLAHRR AERKDD