Gene Sala_1848 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1848
Symbol	ispG
ID	4082026
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	1943525
End bp	1944676
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	68%
IMG OID	638010223
Product	4-hydroxy-3-methylbut-2-en-1-yl diphosphate synthase
Protein accession	YP_616893
Protein GI	103487332
COG category	[I] Lipid transport and metabolism
COG ID	[COG0821] Enzyme involved in the deoxyxylulose pathway of isoprenoid biosynthesis
TIGRFAM ID	[TIGR00612] 1-hydroxy-2-methyl-2-(E)-butenyl 4-diphosphate synthase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.116834
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.404651
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGATC ATAATCCCGG CCTGCGCCCC TGGCGCGACA TTGCACGGCG GACGAGCCGC 
CAGATCATGG TCGGAAACGT CCCCGTCGGC GGCGGCGCGC CGATCAGCGT GCAGACAATG 
ACCAACACGC TGACGAGCGA TCCGGCGCAG ACGATCGACC AGATCCGCCG CTGCGAGGAC 
GCCGGCGCCG ACCTGATCCG CGTCTCGTGC CCCGACACCG ATTCGACCGC GGCGCTCGGC 
AAGATCGTCC GCGCGGCGCG CATTCCGATC ATCGCCGACA TCCATTTCCA CTATAAGCGC 
GCATTGGAAG CCGCCGACGC CGGCGCCGCC TGCCTGCGCA TCAACCCCGG CAATATCGGC 
TCGTCGGAAC GCGTCGGCGA GGTCGTGCGC GCCGCCAAGG CGAACGGCTG CGCGATCCGC 
ATCGGCGTCA ACGCCGGCAG CCTCGAGAAG GACCTGCTCG AAAAATATGG CGAGCCCTGC 
CCCGAGGCGC TCGTCGAAAG CGCGCTCGAC CATATCAAGC TGCTGCAGGA CCATGATTTC 
CACGACTACA AGGTCGCGGT GAAGGCGAGC GACGTCTTCC TCGCGGTCGC CGCCTATGCG 
CAGCTCGCCG ACGCGGTCGA CTGCCCGCTG CACCTCGGCA TCACCGAGGC GGGCGGGCTG 
ATCGGTGGCA CGGTGAAAAG CGCGCTCGGC ATCGGCAACC TGCTCTGGGC CGGGATCGGC 
GACACGATCC GCGTTTCGCT TTCGGCGGAA CCCGAAGAGG AAGTACGCGT CGGCTACGAG 
ATACTGAAAT CGCTGGGCCT CAGAACCCGC GGCGTGCGCG TCGTCTCCTG CCCCAGCTGC 
GCACGACAGG GTTTCGACGT CATCCGCACC GTCCAGGCGC TCGAGGACGC GCTCGGCCAC 
ATCAAGACGC CGATGTCGCT CTCGGTCCTC GGCTGCGTCG TCAACGGCCC CGGCGAAGCG 
CGCGAGACCG ACATCGGCAT CACCGGCGGC GGCAACGGCA GGCATATGGT CTATCTCTCG 
GGCGTCACCG ACCACCATGT CGAGGACGCC GACATGATCG CGCACATCGT CAGGCTCGTC 
GAAGCCAAGG CGGCCGAGAT CGAGGCGGGC AACGCGGTGA GCATGGACGT CGCGCACGGC 
AAGGCGGCGT AG

Protein sequence

MSDHNPGLRP WRDIARRTSR QIMVGNVPVG GGAPISVQTM TNTLTSDPAQ TIDQIRRCED 
AGADLIRVSC PDTDSTAALG KIVRAARIPI IADIHFHYKR ALEAADAGAA CLRINPGNIG 
SSERVGEVVR AAKANGCAIR IGVNAGSLEK DLLEKYGEPC PEALVESALD HIKLLQDHDF 
HDYKVAVKAS DVFLAVAAYA QLADAVDCPL HLGITEAGGL IGGTVKSALG IGNLLWAGIG 
DTIRVSLSAE PEEEVRVGYE ILKSLGLRTR GVRVVSCPSC ARQGFDVIRT VQALEDALGH 
IKTPMSLSVL GCVVNGPGEA RETDIGITGG GNGRHMVYLS GVTDHHVEDA DMIAHIVRLV 
EAKAAEIEAG NAVSMDVAHG KAA