Gene Saro_0417 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0417
Symbol	ispG
ID	3917563
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	455622
End bp	456746
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	66%
IMG OID	640443146
Product	4-hydroxy-3-methylbut-2-en-1-yl diphosphate synthase
Protein accession	YP_495699
Protein GI	87198442
COG category	[I] Lipid transport and metabolism
COG ID	[COG0821] Enzyme involved in the deoxyxylulose pathway of isoprenoid biosynthesis
TIGRFAM ID	[TIGR00612] 1-hydroxy-2-methyl-2-(E)-butenyl 4-diphosphate synthase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCATCGG TACGTCCCTG GCGCGATATC GCGCGTCGCA AGAGCCGCCA GATCATGGTC 
GGCACGGTCC CCGTCGGCGG CGATGCCCCG ATCACCGTGC AGACCATGAC CAACACCCCG 
ACGTCCGACG CCGTCGCCAC GATCGACCAG ATCCGTCGCT GCGAGGAAGC GGGCGCCGAT 
CTTATCCGCG TGTCCTGTCC CGACGTGGAA AGCACAGCGG CCTTCCGCCA GATCGCCCGG 
GCCGCCCGGG TTCCGCTGAT CGCGGACATC CACTTCCACT ACAAGCGCGC GCTCGAAGCG 
GCCGATGCGG GGGCCGCGTG CCTGCGCATC AATCCGGGCA ACATCGGCAG CAGCGACCGC 
GTGGCCGAAG TGGTCCGCGC CGCCAAGGCC AACGGCTGCG CGATCCGCAT CGGCGTCAAC 
GCTGGCAGCC TCGAGAAAGA CCTGCTCGAA AAGTACGGCG AGCCCTGTCC CGAAGCGCTC 
GTCGAATCCG CGCTCGACCA TATCAAGCTG CTGCAGGACC ACGATTTCCA CGAATACAAG 
GTGGCGGTTA AGGCCTCCGA CGTGTTCCTC GCCGTCGCCG CCTACATGGG CCTTGCAGAA 
GCGGTCGATT GCCCGCTGCA TCTTGGCATT ACCGAGGCAG GCGGGCTGAT CGGCGGGACG 
GTGAAATCGT CCGTCGGCAT CGGCAACCTG CTCTGGGCCG GCATCGGCGA CACCTTGCGC 
GTCTCGCTTT CGGCCGAACC GGAAGAGGAA GTGCGCGTCG GGTTCGAGAT CCTCAAGACG 
CTGGGCCTGC GCACGCGCGG CGTCCGCGTC GTGTCGTGTC CGTCCTGCGC TCGGCAGGGT 
TTCGACGTGA TCCGGACCGT GGAGGCGCTG GAAAAGCGGC TGACGCACAT CAAGACGCCG 
ATCTCGCTTT CCGTACTGGG CTGCGTCGTC AATGGACCGG GCGAAGCCCG CGAGACCGAT 
ATCGGCCTCA CCGGCGGCGG CAACGGCAAG CACATGGTCT ATCTTTCGGG CGTGACCGAC 
CACCACGTCC AGTCGGAGGA CATGCTAGAC CACATCGTCT CGCTGGTCGA ACAGAAGGCT 
GCGGAAATGG AAGCCGCTGC CGCAGAAGCG GAAGCGGCAG CCTGA

Protein sequence

MSSVRPWRDI ARRKSRQIMV GTVPVGGDAP ITVQTMTNTP TSDAVATIDQ IRRCEEAGAD 
LIRVSCPDVE STAAFRQIAR AARVPLIADI HFHYKRALEA ADAGAACLRI NPGNIGSSDR 
VAEVVRAAKA NGCAIRIGVN AGSLEKDLLE KYGEPCPEAL VESALDHIKL LQDHDFHEYK 
VAVKASDVFL AVAAYMGLAE AVDCPLHLGI TEAGGLIGGT VKSSVGIGNL LWAGIGDTLR 
VSLSAEPEEE VRVGFEILKT LGLRTRGVRV VSCPSCARQG FDVIRTVEAL EKRLTHIKTP 
ISLSVLGCVV NGPGEARETD IGLTGGGNGK HMVYLSGVTD HHVQSEDMLD HIVSLVEQKA 
AEMEAAAAEA EAAA