Gene Acid345_1423 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1423
Symbol	ispG
ID	4068802
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	1722575
End bp	1723816
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	59%
IMG OID	637983432
Product	4-hydroxy-3-methylbut-2-en-1-yl diphosphate synthase
Protein accession	YP_590499
Protein GI	94968451
COG category	[I] Lipid transport and metabolism
COG ID	[COG0821] Enzyme involved in the deoxyxylulose pathway of isoprenoid biosynthesis
TIGRFAM ID	[TIGR00612] 1-hydroxy-2-methyl-2-(E)-butenyl 4-diphosphate synthase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.412672
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.223242
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTACGA TTTACCGCCG TAAAACTCCT GTTGTTCGCA TTGGAGACGT CTGGGTCGGC 
AGCGACGCGC CGGTTGTGGT GCAGTCGATG ACCAACACCG ACACCGCCGA TGTGGACTCG 
ACGATTAAGC AGTGTATCGC GCTTGCCCGC GCCGGGTCTG AGCTCATCCG CGTCACCGTG 
AACAACGATG ACGCCGCCAA GGGCGTGCCG CATCTCGTTG ACGGCCTGGC CAAGATCGGC 
ATCCATACGC CGATCATCGG CGATTTCCAC TACAACGGCC ACATCCTGCT GAAGAAATAT 
CCCGACTGCG CGAAGGCGTT GGCGAAGTAC CGCATCAATC CCGGCAATGT GTCGATCGGT 
CGCAAGGACG ACGACAACTT CAAGGCCATG GTGGACGTTG CGGTTGAGAA CCAGAAGCCC 
GTCCGCATTG GCGTGAACTG GGGCTCGCTC GACCAGCAGC TTCTCGCGAA GATGATGGAC 
CAGAACGCGA AGCTCGCTGA GCCGAAAGAA GCCCGTGACG TGATGATGGA AGCGATGATT 
GTCTCCGCGC TGAATTCCGC GGCAATCGCC GAACGTTACG GCCTGCGTAA AGATCAGATC 
ATCCTCAGCG CAAAGGTGAG CGGCGTACAG GATTTGATCG ACGTTTATCG CGATCTCGCC 
AAGCGTTGCG ACTACGTGCT GCACCTCGGA TTGACCGAAG CAGGTATGGG AGCGAAGGGC 
GTCGTGGCAT CGACGGCCGG TTTGTCAGTT CTTCTGCTCG AAGGCATTGG CGACACAATT 
CGCGTCTCGC TTACGCCGAA GCCGAATGGC GATCGCACCG AAGAAGTTCT GGTCGCGCAG 
CAGATTTTGC AATCGATGGC GATCCGCAGT TTCACACCGC AGGTGACAGC CTGCCCGGGT 
TGCGGACGAA CCACTAGTAC CTTCTTCCAG GAACTCGCCG AGCGCATCCA GAACTACATT 
CGCGAACAGA TGCCGCAGTG GAAGACCCGC TACACCGGCG TGGAAGAGAT GAAGGTCGCG 
GTGATGGGCT GCGTGGTGAA TGGCCCCGGC GAATCGAAGC ACGCTAACAT CGGCATCTCG 
CTGCCGGGCA CATTTGAGGA GCCGAAGGCG CCCGTGTACG TAGACGGCCG CCTGATGACG 
ACGCTCAAGG GCGACAAGAT CGTCGAGGAG TTTACGACGA TTCTCAACGA GTACGTAGAC 
AACCGATACG CAAAGAAGGC CGAAGAAGCG GTCGGCGTTT AA

Protein sequence

MPTIYRRKTP VVRIGDVWVG SDAPVVVQSM TNTDTADVDS TIKQCIALAR AGSELIRVTV 
NNDDAAKGVP HLVDGLAKIG IHTPIIGDFH YNGHILLKKY PDCAKALAKY RINPGNVSIG 
RKDDDNFKAM VDVAVENQKP VRIGVNWGSL DQQLLAKMMD QNAKLAEPKE ARDVMMEAMI 
VSALNSAAIA ERYGLRKDQI ILSAKVSGVQ DLIDVYRDLA KRCDYVLHLG LTEAGMGAKG 
VVASTAGLSV LLLEGIGDTI RVSLTPKPNG DRTEEVLVAQ QILQSMAIRS FTPQVTACPG 
CGRTTSTFFQ ELAERIQNYI REQMPQWKTR YTGVEEMKVA VMGCVVNGPG ESKHANIGIS 
LPGTFEEPKA PVYVDGRLMT TLKGDKIVEE FTTILNEYVD NRYAKKAEEA VGV