Gene Rpal_0520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_0520
Symbol	ispG
ID	6408169
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	567708
End bp	569003
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	66%
IMG OID	642710432
Product	4-hydroxy-3-methylbut-2-en-1-yl diphosphate synthase
Protein accession	YP_001989555
Protein GI	192288950
COG category	[I] Lipid transport and metabolism
COG ID	[COG0821] Enzyme involved in the deoxyxylulose pathway of isoprenoid biosynthesis
TIGRFAM ID	[TIGR00612] 1-hydroxy-2-methyl-2-(E)-butenyl 4-diphosphate synthase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAAGC TCGAAAATCC GCTGCGAGAC GACGTCGCCG GCCCCGCGCC GCGGCACCAA 
ACCACCCAGG TCATGGTCGG CGATGTGGCC GTCGGCGGCG GTGCCCCGAT CGTCGTTCAG 
TCGATGACCA ATACCGACAC CGCGGATGTC GAGGGCACCA TCAAGCAGAT CGCCGCGCTG 
GCCCGGGCCG GTTCGGAGAT GGTCCGGATC ACCGTCGATC GCGAGGAAGC GGCCGCCGCC 
GTCCCGCACA TCCGCGACGG CATCCGCAAG CTAGGCCTGA CCACGCCGAT CATCGGCGAC 
TTCCATTACA TCGGCCACAA GCTGCTCGCC GAATACCCGG CGTGCGCCGA GGCGCTCGAC 
AAGTACCGGA TCAATCCGGG CAATGTCGGC TTCAAGAACA AGCGTGACAC GCAGTTCGCC 
GACATCGTCG AGATCGCAAT CAAGAACAAT AAGGCGGTCC GCATCGGCGC CAATTGGGGT 
TCGCTCGACC AGGAGCTGCT CACCAAGCTG ATGGACGAGA ACGCTGCGTC GGCCAATCCG 
CGCGACGTCC GCGCCGTCAC CCGCGAGGCG ATGGTCCAGT CGGCGCTGCT GTCGGCCGCG 
CGCGCCGAAG AGATCGGCTT GCCGAAGAAC AAGATGATCC TGTCGGCCAA GGTCTCGGCG 
GTGCAGGACC TGATCGCCGT GTACCAGGAT CTCGCCTCGC GCTCCGATTA CGCGATCCAC 
CTCGGCCTCA CCGAGGCTGG CATGGGCTCG AAGGGCATCG TCGCATCGTC CGCGGCGCTC 
GGCATCCTGC TGCAGCAGGG CATCGGTGAC ACCATTCGGA TTTCGCTGAC CCCCGAGCCG 
GGCGGTGACC GCACCCGCGA GGTTCAGGTT GGGCAGGAAC TGCTGCAGAC CATGGGCTTC 
CGCACCTTCG TGCCGCTGGT TGCGGCCTGC CCGGGCTGCG GCCGCACCAC CTCGACGACG 
TTCCAGGAGC TGGCGCGCTC GATCCAGGAT TTCATCCGCG ACGAGATGCC GGAGTGGCGC 
AGCCGCTATC CGGGCGTCGA GAATCTCAAC GTTGCGGTGA TGGGCTGCAT CGTCAACGGC 
CCGGGCGAAA GCAAGCACGC CAATATCGGC ATTTCGCTGC CCGGCACCGG CGAAACCCCG 
GCGGCGCCGG TGTTCGTCGA CGGCGAGAAA TTCCGTACCC TGCGCGGCGA GAATATCGCG 
GCCGACTTCA AGGCGCTGGT GATCGACTAC ATCGAGCAGC GCTACGGCGC GACGCCGAAG 
CCCGGTGCCG CCCAGATGGT ACCGGCGGCG GAGTAA

Protein sequence

MNKLENPLRD DVAGPAPRHQ TTQVMVGDVA VGGGAPIVVQ SMTNTDTADV EGTIKQIAAL 
ARAGSEMVRI TVDREEAAAA VPHIRDGIRK LGLTTPIIGD FHYIGHKLLA EYPACAEALD 
KYRINPGNVG FKNKRDTQFA DIVEIAIKNN KAVRIGANWG SLDQELLTKL MDENAASANP 
RDVRAVTREA MVQSALLSAA RAEEIGLPKN KMILSAKVSA VQDLIAVYQD LASRSDYAIH 
LGLTEAGMGS KGIVASSAAL GILLQQGIGD TIRISLTPEP GGDRTREVQV GQELLQTMGF 
RTFVPLVAAC PGCGRTTSTT FQELARSIQD FIRDEMPEWR SRYPGVENLN VAVMGCIVNG 
PGESKHANIG ISLPGTGETP AAPVFVDGEK FRTLRGENIA ADFKALVIDY IEQRYGATPK 
PGAAQMVPAA E