Gene CPR_1664 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1664
Symbol	ispG
ID	4206119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	1860187
End bp	1861236
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	32%
IMG OID	642566214
Product	4-hydroxy-3-methylbut-2-en-1-yl diphosphate synthase
Protein accession	YP_698979
Protein GI	110803791
COG category	[I] Lipid transport and metabolism
COG ID	[COG0821] Enzyme involved in the deoxyxylulose pathway of isoprenoid biosynthesis
TIGRFAM ID	[TIGR00612] 1-hydroxy-2-methyl-2-(E)-butenyl 4-diphosphate synthase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.704095
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAATAGAA AAGAAACTAG AAAGGTTAAG ATTGGAAACA TATATGTTGG AGGAGATTTT 
AGAGTTTCCA TTCAATCTAT GACCAATACA GATACAAAAG ATGTAGAATC TACAGTTAAA 
CAAATAAAAG AGCTTCAAGA AGCTGGATGT GATATTGTTA GATGTGCAGT TTTAGATATG 
GATGCAGCTT GCGCTATAAA AGATATAGTG GCAAAAATTA ATATACCACT AGTTGCAGAC 
ATTCATTTTG ATTATAAATT AGCTTTAAAA GCAATAGAAA ATGGAGTTTC TGCAATAAGA 
ATAAATCCAG GAAATATTGG ATCTAGGGAA AAGGTAGAAG CTGTAGTAAA AGCTTGTAAA 
GAAAAAAATA TTCCTATAAG AATAGGGGTT AACTCAGGGT CATTATCAAA AGAGCTTTTA 
GCAAAATACG GAAAACCTAC CCCAGATGCC CTAGTTGAAA GTGCATTAGA ACATGTTAAA 
ATATTAGAAG AGTTAGATTT TCATGATATA GTAATTTCAA TGAAATCATC AAATGTTGAA 
ACTATGATAG AAAGTTATAG AATAGCTTCA CAAAAAACAA ATTATCCTCT TCACTTAGGG 
GTTACTGAGG CTGGTACACC TTGGAGAGGA ACAATAAAAT CTGCTATAGG AATAGGAACT 
TTACTTGCAG AAGGAATAGG TGATACTATA AGAGTTTCTT TAACTGGAGA TCCTGTTGAA 
GAGATAAAAG TAGGTAAAGA AATTCTTAAA AACTTTGGAT ATGTAAAAGA AGGAATAGAG 
TTTATATCAT GTCCTACATG TGGAAGAACT CAAATAGACT TAATAAACAT AGCTAAAGAA 
GTAGAAGAAA GATTAAGTTC TTGCAAGAAA AACATAAAGG TTGCAGTAAT GGGCTGTGTT 
GTAAATGGAC CAGGAGAAGC AAGAGAGGCA GATATTGGAA TAGCTGGGGG TAAAGGCGAA 
GGTCTTATCT TTAGAAAAGG TGAAATAATT AAAAAGGTAA AAGAAGAAGA CTTAGTTGAA 
GAGCTTATAA AGATAATAGA AACAATATAA

Protein sequence

MNRKETRKVK IGNIYVGGDF RVSIQSMTNT DTKDVESTVK QIKELQEAGC DIVRCAVLDM 
DAACAIKDIV AKINIPLVAD IHFDYKLALK AIENGVSAIR INPGNIGSRE KVEAVVKACK 
EKNIPIRIGV NSGSLSKELL AKYGKPTPDA LVESALEHVK ILEELDFHDI VISMKSSNVE 
TMIESYRIAS QKTNYPLHLG VTEAGTPWRG TIKSAIGIGT LLAEGIGDTI RVSLTGDPVE 
EIKVGKEILK NFGYVKEGIE FISCPTCGRT QIDLINIAKE VEERLSSCKK NIKVAVMGCV 
VNGPGEAREA DIGIAGGKGE GLIFRKGEII KKVKEEDLVE ELIKIIETI