Gene Mpe_A1996 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A1996
Symbol	ispG
ID	4783783
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	2138219
End bp	2139517
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	68%
IMG OID	640090566
Product	4-hydroxy-3-methylbut-2-en-1-yl diphosphate synthase
Protein accession	YP_001021189
Protein GI	124267185
COG category	[I] Lipid transport and metabolism
COG ID	[COG0821] Enzyme involved in the deoxyxylulose pathway of isoprenoid biosynthesis
TIGRFAM ID	[TIGR00612] 1-hydroxy-2-methyl-2-(E)-butenyl 4-diphosphate synthase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.165352
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAGGC CAGTAGCGTC CACAGGGACC CGCAGTGACG CCGAAGCGAT CGACGTGGCG 
CAGCCTGCCG CGCGCCGTTC GCTGCAGGCG CGTGTCGTCT GGGGCAGCAA TGTCGTGACG 
GTCGGTGGCG ACGCCCCGGT GCGCGTGCAG TCCATGACCA ACACCGACAC GGTGAATGCG 
ATCGAGACTG CGATCCAGGT CAAGGAGCTG GCGTTGGCGG GCTCGGAGTT GGTGCGCATC 
ACGGTCAACA CGCCGGAGGC GGCGCAGGCC GTGCCGCACG TGCGCGAGCA GCTAGACCGC 
ATGGGCATCT CGGTGCCGCT GATCGGCGAT TTCCACTACA ACGGCCACCG CCTGCTGACC 
GAGTTCCCGG ACTGCGCGGC CGCGCTGTCG AAGTACCGCA TCAATCCCGG CAACGTGGGC 
AAGGGCGACA AGCGCGACCG GCAGTTCGCG ATGATGATCG AGGCCGCGAT GCGCCACGAC 
AAGCCTGTGC GTATCGGCGT CAACTGGGGC AGCCTCGATC AGGAACTGCT GGCGGCTTTG 
ATGGACGAGA ACGCCGCCCG CGCCCGGCCC TGGGACGCGA AGCAGGTGAT GTACCACGCG 
CTGATCAGCT CGGCGCTGCA GTCGGCCGCA TATGCGCGCG AGCTGGGCAT GGACCCGTCC 
CAGATCCTCA TCAGCTGCAA GGTCAGCGGC GTGCAGGACC TCGTGAGCGT CTACCGCGCA 
CTGGCGCGAC GCTGCGATTA CCCGCTGCAC CTCGGGCTCA CCGAAGCCGG CATGGGCACC 
AAGGGCACCG TGGCGTCGAC CGCGGCGCTG GCGATGCTGC TGCAGGACGG CATCGGCGAC 
ACCATCCGCG TCAGCCTCAC GCCGCAGCCG GGCGAGGCCC GCACGCAGGA GGTGGTGGTG 
GCGCTCGAGA TCCTGCAGTC GCTCGGCCTG CGTGCCTTCA ATCCCAGCGT CACCGCCTGC 
CCGGGCTGCG GCCGCACCAC CAGCACCACC TTCCAGGAGC TGGCCAAGCA GATCGACGAC 
TTCCTGCGGG CACAGATGCC GGTCTGGAAG GCGCGTTACC CGGGCGTGGA GAACATGAAG 
GTGGCGGTGA TGGGCTGCAT CGTCAACGGG CCTGGCGAGA GCAAGCATGC CGATATCGGC 
ATCAGCCTGC CCGGCACCGG CGAGGCGCCT GCCGCGCCGG TGTTCATCGA TGGCGAGAAG 
GCGATGACCT TGCGCGGCGA GGGCATCGCG CGCGAGTTCC AGAACGTCGT CGAGCACTAC 
ATCGAGCGCC GTTACGGCAG CATCACCGCC GCGCATTGA

Protein sequence

MNRPVASTGT RSDAEAIDVA QPAARRSLQA RVVWGSNVVT VGGDAPVRVQ SMTNTDTVNA 
IETAIQVKEL ALAGSELVRI TVNTPEAAQA VPHVREQLDR MGISVPLIGD FHYNGHRLLT 
EFPDCAAALS KYRINPGNVG KGDKRDRQFA MMIEAAMRHD KPVRIGVNWG SLDQELLAAL 
MDENAARARP WDAKQVMYHA LISSALQSAA YARELGMDPS QILISCKVSG VQDLVSVYRA 
LARRCDYPLH LGLTEAGMGT KGTVASTAAL AMLLQDGIGD TIRVSLTPQP GEARTQEVVV 
ALEILQSLGL RAFNPSVTAC PGCGRTTSTT FQELAKQIDD FLRAQMPVWK ARYPGVENMK 
VAVMGCIVNG PGESKHADIG ISLPGTGEAP AAPVFIDGEK AMTLRGEGIA REFQNVVEHY 
IERRYGSITA AH