Gene EcSMS35_0184 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0184
Symbol	dxr
ID	6142607
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	202703
End bp	203899
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	53%
IMG OID	641615085
Product	1-deoxy-D-xylulose 5-phosphate reductoisomerase
Protein accession	YP_001742301
Protein GI	170683853
COG category	[I] Lipid transport and metabolism
COG ID	[COG0743] 1-deoxy-D-xylulose 5-phosphate reductoisomerase
TIGRFAM ID	[TIGR00243] 1-deoxy-D-xylulose 5-phosphate reductoisomerase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.103209
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCAAC TCACCATTCT GGGCTCGACC GGCTCGATTG GTTGCAGCAC GCTGGACGTG 
GTGCGCCATA ATCCCGAACA CTTCCGCGTA GTTGCGCTGG TGGCAGGCAA AAATGTCACT 
CGCATGGTAG AACAGTGCCT GGAATTCTCT CCCCGCTATG CCGTAATGGA CGATGAAGCG 
AGTGCGAAAC TTCTTAAAAC GATGCTACAG CAACAGGGTA GCCGCACCGA AGTCTTAAGT 
GGGCAACAAG CCGCTTGCGA TATGGCAGCG CTTGAGGATG TTGATCAGGT GATGGCAGCC 
ATTGTTGGCG CTGCTGGGCT GTTACCTACG CTTGCTGCGA TCCGCGCGGG TAAAACCATT 
TTGCTGGCCA ATAAAGAATC ACTGGTTACC TGCGGACGTC TGTTTATGGA CGCCGTAAAG 
CAGAGCAAAG CGCAATTGTT ACCGGTCGAT AGCGAACATA ACGCCATTTT TCAGAGTTTA 
CCGCAACCTA TCCAGCATAA TCTGGGATAC GCTGACCTTG AGCAAAATGG CGTGGTGTCC 
ATTTTACTTA CCGGGTCTGG TGGCCCTTTC CGTGAGACGC CATTGCGCGA TTTGGCAACA 
ATGACGCCGG ATCAAGCCTG CCGTCATCCG AACTGGTCGA TGGGGCGTAA AATTTCTGTC 
GATTCGGCTA CCATGATGAA TAAAGGTCTG GAATACATTG AAGCGCGTTG GCTGTTTAAC 
GCCAGCGCCA GCCAGATGGA AGTGCTGATT CACCCGCAGT CAGTGATTCA CTCAATGGTG 
CGCTATCAGG ACGGCAGTGT TCTGGCGCAG CTGGGGGAAC CGGATATGCG TACGCCAATT 
GCCCACACCA TGGCATGGCC GAATCGCGTG AACTCTGGCG TGAAGCCGCT CGATTTTTGC 
AAACTAAGTG CGTTGACATT TGCCGCACCG GATTATGATC GTTATCCATG CCTGAAACTG 
GCGATGGAGG CGTTCGAACA AGGCCAGGCA GCGACGACAG CATTGAATGC CGCAAACGAA 
ATCACCGTTG CTGCTTTTCT TGCGCAACAA ATCCGCTTTA CGGATATCGC CGCGTTGAAT 
TTATCCGTAC TGGAAAAAAT GGATATGCGC GAACCACAAT GTGTGGACGA TGTGTTATCT 
GTTGATGCGA ACGCGCGTGA AGTCGCCAGA AAAGAGGTGA TGCGTCTCGC AAGCTGA

Protein sequence

MKQLTILGST GSIGCSTLDV VRHNPEHFRV VALVAGKNVT RMVEQCLEFS PRYAVMDDEA 
SAKLLKTMLQ QQGSRTEVLS GQQAACDMAA LEDVDQVMAA IVGAAGLLPT LAAIRAGKTI 
LLANKESLVT CGRLFMDAVK QSKAQLLPVD SEHNAIFQSL PQPIQHNLGY ADLEQNGVVS 
ILLTGSGGPF RETPLRDLAT MTPDQACRHP NWSMGRKISV DSATMMNKGL EYIEARWLFN 
ASASQMEVLI HPQSVIHSMV RYQDGSVLAQ LGEPDMRTPI AHTMAWPNRV NSGVKPLDFC 
KLSALTFAAP DYDRYPCLKL AMEAFEQGQA ATTALNAANE ITVAAFLAQQ IRFTDIAALN 
LSVLEKMDMR EPQCVDDVLS VDANAREVAR KEVMRLAS