Gene CPR_1787 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1787
Symbol	dxs
ID	4205334
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	1986054
End bp	1987913
Gene Length	1860 bp
Protein Length	619 aa
Translation table	11
GC content	30%
IMG OID	642566337
Product	1-deoxy-D-xylulose-5-phosphate synthase
Protein accession	YP_699102
Protein GI	110802844
COG category	[H] Coenzyme transport and metabolism [I] Lipid transport and metabolism
COG ID	[COG1154] Deoxyxylulose-5-phosphate synthase
TIGRFAM ID	[TIGR00204] 1-deoxy-D-xylulose-5-phosphate synthase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGAAA TTCTACAGAA AATAACTGAT CCTAAAGAAA TAAAGGATTT AGATGAGAAA 
GAATTAGAAA TGTTAGCTAA AGAGCTAAGA GAATTTTTAA TAGAAAGCGT TTCAAATACT 
GGTGGACATT TTGCTTCAAA CTTAGGTGTT ATAGATCTAA CAGTAGCTTT ATTTAAAAAT 
TTTGATTTTA GTGAAAATAG AATAATATGG GATGTAGGAC ATCAATCTTA TGCTTATAAG 
ATATTAACTG GAAGAAAAGA TAAATTTAAT ACTTTAAGAC AATATGGTGG ATTGTGTGGT 
TTTCCTAAGA GGACAGAAAG CGAATATGAT TTTTTTGCCA CTGGACATAG TAGTACATCA 
TTATCTTCAG CAGCAGGTAT GGCTAGAGCT CAGAAGATTC TTGGAAAAGA TAATAAGGTC 
ATAGCAGTTA TAGGTGATGG AGCCTTAACT GGAGGTATGG CTTTAGAAGC CTTAAACGAT 
ATTGGATATA GAAAAGATAA TCTTATAATA ATATTAAATG ATAATCAAAT GTCTATATGT 
AAAAATGTTG GAGGACTTGC AACCTATTTA AATAAGCTTA GAATGGGTGT AGGTTATAAT 
AAATTAAAAT CAGATATTGG ATCAACTTTA GATACAACTT CTTTGGGCAA AAGAGTAAAG 
AACTCTCTTT CAAAATTAAA AGATGGTATC AAAAAGATTG TTGTACCAAG TATGTACTTT 
GAGGATATTG GATTAAAATA TTTTGGCATA GTAGATGGAC ATAACATTAG AGAATTAAAT 
GAAGTTTTAA GTATAGCTAA AAGTATAAAA GGACCAGTTA TAATACATAC AGTTACTAAA 
AAAGGAAAAG GATATGAATT AGCAGAAAAA AATCCTAATA AATATCATGG AGTATCTCCT 
TTTGATTTAG GAGAAGGAGT GATTTCAAAG TTTGCAAATA GAAATTATTC TTCTACCTTT 
GGAGAAGAAA TGATTAAATT AGCTAAAAAT GATGACAAAG TTGTTGCAAT TACAGCTGCT 
ATGCCAGATG GAACAGGATT AAAAGACTTT AGAGAAGAAT TTCCTGATAG ATTTTTTGAT 
GTAGGTATAG CGGAACAACA TGCTGTTACA TTAGCTGCTG GAATGGCGGC AGAAGGTTTA 
AAACCATTTT TTGCAGTCTA TTCTACTTTC TTACAAAGAG CTTATGACCA AGTTTTACAT 
GATGTATGCA TACAAAATCT ACCTGTTACA CTTTGTCTAG ATAGAGCTGG CTTAGTTGGA 
GAAGATGGAG AAACTCATCA AGGTATATTC GATATTTCAT TTTTATCTCC AATGCCTAAT 
ATGACTATTG TTGCACCTAA GTGTATAGAT GAAATGGAAG TTATCTTAAA ATGGGCAAGT 
AATTTTAATG CACCTTTAGC TATAAGATAT CCAAGAGGTG GAGATATTGA TGTTAATTTA 
AAACCATTAA GTAAAATAGA ATATGGAAAA TGGGAAAAGG TTCAAGAGGG AGAGAAGATA 
GCAATAGTTG CTACTGGTAA AATGGTTCAA CATGCTATGA TTGCTGCACA AAAGATAAAA 
GAAGAAAAAA ATATAGATAT TTTAATTATA AATGCAACCT TTATAAAACC AATAGATAAA 
GAATTATTAA ATTCCTTGTC AAAGGATGGA TTTAAGATTG TAACTATTGA AGATAATATT 
AAAAAAGGTG GCTTTGGAGA AGGCGTTCTA GAGTATTTAA ATGAAATTGG ACATGAAGAA 
AAAATTGTTA CATTAGCATT TAATGATAAG TTTATAGAAC ATGGTAAGCC TGATATTTTA 
TATAGAATTA ATGGATTAGA TGCAGAGGGA ATAAAAAACA CATTAATTGA ATTACTTTAA

Protein sequence

MSEILQKITD PKEIKDLDEK ELEMLAKELR EFLIESVSNT GGHFASNLGV IDLTVALFKN 
FDFSENRIIW DVGHQSYAYK ILTGRKDKFN TLRQYGGLCG FPKRTESEYD FFATGHSSTS 
LSSAAGMARA QKILGKDNKV IAVIGDGALT GGMALEALND IGYRKDNLII ILNDNQMSIC 
KNVGGLATYL NKLRMGVGYN KLKSDIGSTL DTTSLGKRVK NSLSKLKDGI KKIVVPSMYF 
EDIGLKYFGI VDGHNIRELN EVLSIAKSIK GPVIIHTVTK KGKGYELAEK NPNKYHGVSP 
FDLGEGVISK FANRNYSSTF GEEMIKLAKN DDKVVAITAA MPDGTGLKDF REEFPDRFFD 
VGIAEQHAVT LAAGMAAEGL KPFFAVYSTF LQRAYDQVLH DVCIQNLPVT LCLDRAGLVG 
EDGETHQGIF DISFLSPMPN MTIVAPKCID EMEVILKWAS NFNAPLAIRY PRGGDIDVNL 
KPLSKIEYGK WEKVQEGEKI AIVATGKMVQ HAMIAAQKIK EEKNIDILII NATFIKPIDK 
ELLNSLSKDG FKIVTIEDNI KKGGFGEGVL EYLNEIGHEE KIVTLAFNDK FIEHGKPDIL 
YRINGLDAEG IKNTLIELL