Gene Dtox_0589 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_0589
Symbol
ID	8427524
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	+
Start bp	610036
End bp	611700
Gene Length	1665 bp
Protein Length	554 aa
Translation table	11
GC content	49%
IMG OID	645032954
Product	dihydroxy-acid dehydratase
Protein accession	YP_003190132
Protein GI	258513910
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0000577484
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCGTAGTG ATGCTATGAA ATTAGGTCTG GAAAAAGCTC CTCACAGATC CCTGTTTAAA 
GCATTGGGTT ATACTGACCA GGAATTGGCC AGACCTTTAA TAGGTGTAGT GAATGCACAA 
AATGAAATAG TTCCCGGTCA TCTCCATCTG GACGATATTG CTGAGGCAGT TAAGGCCGGA 
ATCAGGATGG CCGGCGGTAC TCCGATAGAA TTTCCCGCTA TTGCAGTTTG TGACGGTATC 
GCCATGAATC ACACAGGCAT GAAGTACTCA TTGGCCAGCC GTGAGTTGAT TGCTGATTCC 
ATTGAAGTTA TGTCTATCGC GCATCCTTTT GACGGCTTAG TTTTAATTCC CAGCTGTGAC 
AAGATAGTTC CGGGCATGTT GATGGCGGCG GCCCGCTTGA ATATTCCGGC TATAGTTGTC 
AGTGGCGGTC CGATGCTGGC AGGTAAAATT AAGGGCCAGC ATAAATCCCT GACAAATGTT 
TTTGAGGCTG TGGGTTCTGT AAGAGCCGGC AAGATGTCGG AAGAAGAGTT GGCCGATTTG 
GAAGAGGCCG CTTGTCCCGG TTGCGGTTCC TGTTCGGGTA TGTTTACGGC TAATTCAATG 
AATTGCTTAA CTGAAGTGCT GGGTATGGCC CTGCCGGGCA ACGGAACCAT TCCCGCTGTT 
TCGGCAGCAC GCAGGCGTTT GGCTAAACAG ACAGGCATGC AGATAATGTA TCTGGTGAAA 
GAAAACATTT GTCCCTCGGA TATTCTAACC ATGGATGCTT TCAATAACGG CTTGACCGTG 
GATATGGCGC TTGGTTGTTC AACCAATACG ATTTTACACC TGCCTGCCAT TGCCAGTGAG 
GCGGGAGTGA TCATTGATCT GGAGCTGGTT AATAAAACCA GCGAGCGCAC ACCGAATCTG 
TGCAAGTTAA GCCCGGCCGG GCCGCATTTT ATTGAAGAAC TGGATGAGGC AGGCGGCATA 
CCGGCTGTAA TGGCAGAACT CTCAAAGCAC GATTTGTTGA ATTTGAACAG CAGAACAGTA 
TCCGGAGTTA CTGTAGGGGA AAACATCAAC GGCAGTAGAG TATTGCGCCG GGATATTATC 
CGCAATATTG AAGATCCTTA TAGTCCCAGC GGCGGTATCA CTGTTATGAG AGGCAATCTC 
GCTCCGGACG GCGCTGTGGT GAAGAAATCC GCAGTAGCAC CTGAGATGCT GGTGCACCGG 
GGTCCGGCCC GCGTGTTCAA CTCGGAAGAG GAATCAATGG ATGCCATTAT GAACCAGACT 
ATACAAAAAG GTGATGTAGT GGTTATCCGT TATGAAGGCC CCAGGGGCGG GCCCGGTATG 
AGAGAGATGC TTACCCCGAC GGCTACCTTG GCCGGTCTGG GTTTGGATAA AGAAGTAGCT 
TTGTTAACTG ACGGCCGCTT CTCCGGAGCA ACCAGGGGAG CCGCTATTGG CCACGTTTCG 
CCGGAAGCAG CTCTGGGCGG TGTTATAGCT GTAATTCAAG ATGGAGATAT GATAGATATT 
GATATTCCCA ACTGCCGCCT AAACGTAGAT TTGACAGAAG CTGAAATAGA CGAAAGAATG 
AAAAAGCTGG TAATACCGGA GCCAAAGATT ACAAGAGGAT ATCTGGCCCG TTACGCAAAA 
ATGGTTACTT CTGCAAGTAC AGGAGCAGTA TTGGCAAAAG ATTGA

Protein sequence

MRSDAMKLGL EKAPHRSLFK ALGYTDQELA RPLIGVVNAQ NEIVPGHLHL DDIAEAVKAG 
IRMAGGTPIE FPAIAVCDGI AMNHTGMKYS LASRELIADS IEVMSIAHPF DGLVLIPSCD 
KIVPGMLMAA ARLNIPAIVV SGGPMLAGKI KGQHKSLTNV FEAVGSVRAG KMSEEELADL 
EEAACPGCGS CSGMFTANSM NCLTEVLGMA LPGNGTIPAV SAARRRLAKQ TGMQIMYLVK 
ENICPSDILT MDAFNNGLTV DMALGCSTNT ILHLPAIASE AGVIIDLELV NKTSERTPNL 
CKLSPAGPHF IEELDEAGGI PAVMAELSKH DLLNLNSRTV SGVTVGENIN GSRVLRRDII 
RNIEDPYSPS GGITVMRGNL APDGAVVKKS AVAPEMLVHR GPARVFNSEE ESMDAIMNQT 
IQKGDVVVIR YEGPRGGPGM REMLTPTATL AGLGLDKEVA LLTDGRFSGA TRGAAIGHVS 
PEAALGGVIA VIQDGDMIDI DIPNCRLNVD LTEAEIDERM KKLVIPEPKI TRGYLARYAK 
MVTSASTGAV LAKD