Gene Dtox_3989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_3989
Symbol
ID	8431004
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	-
Start bp	4175915
End bp	4176952
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	43%
IMG OID	645036207
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_003193305
Protein GI	258517083
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.170063
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTATGC ACGTGGGTCA TAAATCACCG GATACCGGTA AAATATACCT TATTACCGGA 
GCGGCAGGTT TTATCGGATT CTTCTTGTCC AAGAGACTGC TGGAGCAAGG CTGCCGGGTA 
ATTGGTATTG ACAATATAAA TGATTACTAT GATGTTAAGC TTAAGTACGC CCGTTTGGAA 
CAGCTTAAAC TCTTTGAGCA GTTTACCTTT GTTGAGGGTG ACATTTCAGA TAAGGATGTA 
ATAACCGGGA CCTTTCAGGA GTATAGGCCT AATATTGTGG TAAACCTGGC AGCTCAAGCC 
GGAGTGCGGT ATTCCCTGGA GAATCCTGAC GCATATATCC AGAGCAATAT CATAGGTTTT 
TTTAACATTC TTGAAGCCTG CAGATATAGC CCGGTTGATC ACCTGGTTTA TGCATCATCA 
AGTTCTGTAT ATGGATCTAA CAAAAAAGTA CCGTTTGAAG AATCGGATTT CGTAGATCAC 
CCGGTATCAC TCTATGCAGC CACGAAAAAA TCAAACGAAT TGATGGCTCA TACTTACAGT 
CACCTGTATA AAATACCGTC AACAGGACTG AGGTTTTTCA CAGTTTACGG TCCGATGGGC 
CGCCCCGATA TGGCATATTT CGGTTTCACG CAGAGGTACT TTGCGGGAGA GCCTATCAGA 
ATATTCAACA ATGGCGATTT TGAAAATGAT CTTTACCGGG ATTTTACTTA CATTGATGAT 
ATCGTAGAGG GCATTGAGCG GCTTCTATGT AAAGCCCCTG ATAAGACTGT CCCGCATAAA 
GTCTTTAATA TTGGAAACAA CAGTCCTGAA AAGCTGATGG TATTTATCGA AACGCTGGAG 
AAGTGCTTGA GCAAGTCTGC CGGGAGAGAG ATAGTATTTA ATAAAATATA TGAGCCTATT 
AAGCCCGGTG ACGTACCGGC AACATATGCG GATACCGGTT TGCTGCAGGA AGCCGTGGGA 
TTTAAACCTG AGACTTCGAT AGAAGAGGGG TTGCAAAGAT TTGCTGATTG GTATGTTGAG 
TATTATAAGA TGAAGTAG

Protein sequence

MVMHVGHKSP DTGKIYLITG AAGFIGFFLS KRLLEQGCRV IGIDNINDYY DVKLKYARLE 
QLKLFEQFTF VEGDISDKDV ITGTFQEYRP NIVVNLAAQA GVRYSLENPD AYIQSNIIGF 
FNILEACRYS PVDHLVYASS SSVYGSNKKV PFEESDFVDH PVSLYAATKK SNELMAHTYS 
HLYKIPSTGL RFFTVYGPMG RPDMAYFGFT QRYFAGEPIR IFNNGDFEND LYRDFTYIDD 
IVEGIERLLC KAPDKTVPHK VFNIGNNSPE KLMVFIETLE KCLSKSAGRE IVFNKIYEPI 
KPGDVPATYA DTGLLQEAVG FKPETSIEEG LQRFADWYVE YYKMK