Gene Rleg2_3831 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_3831
Symbol	ispG
ID	6982594
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	3963288
End bp	3964538
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	63%
IMG OID	643398553
Product	4-hydroxy-3-methylbut-2-en-1-yl diphosphate synthase
Protein accession	YP_002283319
Protein GI	209551402
COG category	[I] Lipid transport and metabolism
COG ID	[COG0821] Enzyme involved in the deoxyxylulose pathway of isoprenoid biosynthesis
TIGRFAM ID	[TIGR00612] 1-hydroxy-2-methyl-2-(E)-butenyl 4-diphosphate synthase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTCCAA CTGCCGATTT TGATCCGAAA CCGCGCCGCG CGTCCGTTGC CGTCGATGTC 
GGCGGCGTCA TCGTCGGCGG CGGGGCGCCG GTGGTCGTGC AATCGATGAC GAACACTGAC 
ACGGCCGATA TCGATTCGAC CGTCGCCCAG GTCGCCGCTC TCCACCGGGC GGGCTCGGAG 
CTGGTACGCA TCACCGTCGA CCGTGACGAG AGTGCGGCCG CCGTGCCCAA GATCCGCGAG 
CGGCTGTTGC GGCTCGGCAT GGACGTGCCA TTGATCGGCG ACTTCCATTA TGTCGGCCAC 
AAACTGCTTG CCGATCACCC TGATTGTGCC GCAGCGCTCG CGAAATACCG CATCAATCCC 
GGCAATGTCG GCTTCAAGGA CAAGAAGGAC AAGCAGTTCG CCGAGATCAT CGAGATGGCG 
ATCCGCTACG ACAAGCCGGT GCGCGTCGGC GTCAACTGGG GTTCGCTCGA TCAGGATCTC 
TTGACGGCGC TGATGGATGA GAATGCTAGA GCCGGTTCGC CGCTTTCGGC CCGGCAGGTA 
ACACGCGAGG CGATCGTGCA ATCGGCGCTC CTTTCGGCAG CCCTTGCCGA AGAGATCGGC 
CTGCCGCGCA ACCGCATCAT CCTGTCGGCC AAGGTCAGCC AGGTCCAGGA CCTGATCGCC 
GTCAATTCCA TGCTTGCCGA ACGCTCCAAT CATGCGCTTC ATCTCGGCCT GACCGAAGCC 
GGCATGGGCA CCAAGGGCAT CGTCGCCTCA TCGGCGGCGA TGGGTTTCGT GCTCCAGCAC 
GGCATCGGCG ATACGATCCG CGTATCGCTG ACGCCGGAGC CGAACGGCGA CCGCACGCGC 
GAAGTTCAGG TAGCGCAGGA AATCCTGCAG GTCATGGGCT TCCGCCAGTT CATTCCTGTC 
GTTGCCGCCT GTCCTGGCTG CGGACGCACG ACGTCGACAG TGTTCCAGGA GCTTGCCCAG 
AACATCCAGA ACGACATCCG CAAGAACATG CCGGTCTGGC GCGAGAAATA TCCGGGCGTC 
GAGGCGCTGA ATGTTGCCGT CATGGGCTGC ATCGTCAACG GACCGGGCGA AAGCAAACAT 
GCCGATATCG GCATTTCGCT TCCCGGCACC GGCGAGACGC CGGCAGCCCC GGTCTTCATC 
GACGGGAAGA AGGCGCTGAC ATTGCGCGGT CCCAATATCG CTGCCGACTT CGAGGCGCTC 
GTCGTCGACT ATATCGAGAA GCGTTTCGGC CAGCGGACGG CGGCGGAATG A

Protein sequence

MSPTADFDPK PRRASVAVDV GGVIVGGGAP VVVQSMTNTD TADIDSTVAQ VAALHRAGSE 
LVRITVDRDE SAAAVPKIRE RLLRLGMDVP LIGDFHYVGH KLLADHPDCA AALAKYRINP 
GNVGFKDKKD KQFAEIIEMA IRYDKPVRVG VNWGSLDQDL LTALMDENAR AGSPLSARQV 
TREAIVQSAL LSAALAEEIG LPRNRIILSA KVSQVQDLIA VNSMLAERSN HALHLGLTEA 
GMGTKGIVAS SAAMGFVLQH GIGDTIRVSL TPEPNGDRTR EVQVAQEILQ VMGFRQFIPV 
VAACPGCGRT TSTVFQELAQ NIQNDIRKNM PVWREKYPGV EALNVAVMGC IVNGPGESKH 
ADIGISLPGT GETPAAPVFI DGKKALTLRG PNIAADFEAL VVDYIEKRFG QRTAAE