Gene Dtox_3204 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_3204
Symbol
ID	8430198
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	-
Start bp	3405531
End bp	3406691
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	50%
IMG OID	645035450
Product	1-deoxy-D-xylulose 5-phosphate reductoisomerase
Protein accession	YP_003192569
Protein GI	258516347
COG category	[I] Lipid transport and metabolism
COG ID	[COG0743] 1-deoxy-D-xylulose 5-phosphate reductoisomerase
TIGRFAM ID	[TIGR00243] 1-deoxy-D-xylulose 5-phosphate reductoisomerase

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000173626
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.00000412307
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAATAAAA AAATTGCTGT TTTGGGAAGT ACCGGTTCTA TTGGCAGGCA AACTTTGCAA 
ATAGCGGAAA GCTGTCCCGG TCAGCTTGAG GTGGTTGGTC TGGCGGCAGG TAGAAACTGG 
CCGCTTCTGG TTGAGCAGGT GAAAAAATTT CGGCCGGCAG TTGTAGCTGT GGCGGGAGAA 
ACAGAAGCGG TTCAATTGAG AGCCGGTCTG GGCGCTGAAT ATAAGGTGGA GATTTATACA 
GGTGCAGAGG GTTTGGAGGT TATCGCCTCG TTATCTGAGG TTGATACTGT GGTCACCGCG 
GTAACAGGTA CTGTTGGGCT GTCCCCGACT GTTGCAGCCA TTAAGGCCGG CAAGCATATA 
GCTTTGGCCA ATAAAGAGAC ACTGGTGGCG GCCGGGGAGT TGGTCATGCA GTTGGCTGAT 
AGCCACGGGA TAAGTATTTT GCCGGTGGAC AGTGAACATT CGGCTATCTG GCAGTGTTTG 
AACGGTGAAA AGCGAGCTGC TTTGCAAAAG ATAATTTTAA CTGCCTCGGG CGGCCCTTTT 
CGGGAAAAGA GCTTCGGAGA GCTGGCGGCA GTCACGGTAG AAATGGCTTT AGCCCATCCT 
AACTGGTCTA TGGGTAAGAA AATTACTGTT GATTCGGCGA CTTTGATGAA TAAAGGGCTG 
GAGGTGATAG AGGCCCACTG GCTGTATGAT GTTGCCTATG AGTCTATTCA GGTGGTTATT 
CACCCTCAGA GTATTATACA CTCTATGGTT GAATTTGTTG ACGGCTCGGT TATAGCCCAG 
TTGGGTTTGC CTGATATGAG GTTGCCTATT CAGTATGCTT TATCCTATCC TGACAGGTGG 
GAGTCTAAAT TGCCGCGCCT GGACTTCAAG AATCAGTTTG GGTTGACCTT TGAGCAGCCT 
GATTTTGAGC GTTTTCCCTG TTTGGGCCTG GCTTTTGCCG CAGGCCGGGC CGGCGGCACT 
ATGCCGGCCG TGCTCAATGC AGCCAATGAG ACTGCGGTTG CCGCATTTTT GGAGAAACGC 
TTATCCTATC AAGGCATTGC TTCCCTGGTA GATGAAGTTA TGAATTTACA CCGGGTAATC 
AAACATCCTG ATCTTGAAAC TGTATTGCAG GTAGATATCT GGGCGCGTCG TCAGGCAGCA 
CGACTGATTG GAAAACTTTA G

Protein sequence

MNKKIAVLGS TGSIGRQTLQ IAESCPGQLE VVGLAAGRNW PLLVEQVKKF RPAVVAVAGE 
TEAVQLRAGL GAEYKVEIYT GAEGLEVIAS LSEVDTVVTA VTGTVGLSPT VAAIKAGKHI 
ALANKETLVA AGELVMQLAD SHGISILPVD SEHSAIWQCL NGEKRAALQK IILTASGGPF 
REKSFGELAA VTVEMALAHP NWSMGKKITV DSATLMNKGL EVIEAHWLYD VAYESIQVVI 
HPQSIIHSMV EFVDGSVIAQ LGLPDMRLPI QYALSYPDRW ESKLPRLDFK NQFGLTFEQP 
DFERFPCLGL AFAAGRAGGT MPAVLNAANE TAVAAFLEKR LSYQGIASLV DEVMNLHRVI 
KHPDLETVLQ VDIWARRQAA RLIGKL