Gene Dole_2026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2026
Symbol
ID	5694866
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2455026
End bp	2456732
Gene Length	1707 bp
Protein Length	568 aa
Translation table	11
GC content	56%
IMG OID	641264624
Product	metal dependent phosphohydrolase
Protein accession	YP_001529907
Protein GI	158522037
COG category	[T] Signal transduction mechanisms
COG ID	[COG2206] HD-GYP domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00491297
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCAAA AAAATTCAAC GGAAGACCTT GACGTCAGTC GACTGTCCGC AGACAAAAAG 
CTCGGCCACC TGCTGGAGAG TGTCGTCCGT GAAGTGAAAC TTTATGCCGA AGGGCAGATT 
GAACACATTC AGAAACTGGC CCAGATCGGC CTGGCCCTGT CCGGCCAGAA AAATCTCAAC 
ACCCTGCTCG AGATGATCGT GGACGAGGCC CGGAAACTTT CCAGCGCCGA TGCCGGCACC 
CTGTACATCG TGGAGCAGAA AAGCCGGTCC CTCCGGTTTG CCATTCTTCA AAACGACTCC 
ATGAACATTC GAAAGGGCGG CGCAGGCGGC GACCTTTCCG ATGAAATGCC CAACGTTCCC 
CTGGCCGACG AACAGGGCAA CCCCAACCAT GCCAATGTTT CCTCCTATGT GGCCCTGACC 
GGGGAAAGCG TCAACATCGA AGATGTGTAT GAAGCCGGGG CGTTCGATTT TTCCGGCACC 
AAGCGGTATG ACGCCGCCAC CGGCTACCGC TGCAAATCCA TGCTGGTCAT GCCGTTAAAA 
AACCACGAGG ACAAGATTAT CGGCGTGTTG CAGCTGTTAA ACGCCAAGGA CCCCCAGACC 
GGGGAAATCA TGAAGTTCCA TGCGGACATC GTGGGGCTGG TCGCTTCCCT GGCCTCCCAG 
GCGGCCATCG CGCTGACCAA CACCCAGTTG ATCGAAGATC TCAAAGCTCT TTTCTACGCA 
TTTATCAAAA GCATTGCCAC GGCCATTGAT GCCAAATCCC CTTTTACCGG GGGGCACATC 
AACCGGGTGG TAAGCCTGAC CATGGATGTT GCCGAAGCGA TTCACGGCAC CAACACCGGT 
CCTTTTGGAG AGATGCGCTT CACCGATGAC GAAATGGAAG AACTGCGCAT TGCCGCGTGG 
ATGCATGACG TGGGCAAAAT CACCACGCCG GAGCATATTG TCAGCAAGAC CAACAAACTC 
GAAGGCGTCT TTGATCGGAT TCACCTGATC GAAACACGGT TTCTGCTGAT CCTTCAGCTG 
ATGGAAAACC GCCACCTGCG TGTCAAGATC GACCTCCTCA AAACCGACAA CAGTCCGGCG 
GCCCTTAAAA AAATGGAGGC CATGGACCGC GAACTCCAGG CCCGGAAAGC GGAGATACTG 
GAAAGCCTGG AACTTTTAAA GGCCGTAAAC ACGAACAAAG GCATGGTGGA TGAACGTGCG 
GTAAAGCAGG TCCGAGAGAT TGCGGCCCGC ACCTACCATA TCGGCGGCAA CGCCTACCCC 
TGGTTGTCTG AGAACGAGGC TGCCTGCCTG AGCATTCTCA AGGGCAACCT GCTGGACGAG 
GAACGGCGGC TGGTGGAGCA GCATGCGGAG ATGACCATCA ACATCACCAG GGAACTCCCC 
TTTCCGGACC GTTTTTCCCA CGTTCCCGAA TATGCCGGGG CCCATCACGA AAAGCTGGAC 
GGTTCCGGAT ATCCTCTGGG ACTTACCGGT GACCAGATTC CCCTGCAGGC CAGGATCATC 
GCCATTGCGG ATGTCTTCGA GGCCCTGACC GCGCCGGACC GGCCCTACAA ACGGCCCATG 
CACATTTCAC AGGCATTGAA AATTCTTCAG GAGATGGCGG CGGCCGGCCA CATCGACGGG 
GATATCGTCA GGATGTTTAT CAAACAAAAA GTTTACCAGG CATACGCGGA CAAAGAACTT 
ACACCGGAGC AGCTCTCCAC TGCATAA

Protein sequence

MTQKNSTEDL DVSRLSADKK LGHLLESVVR EVKLYAEGQI EHIQKLAQIG LALSGQKNLN 
TLLEMIVDEA RKLSSADAGT LYIVEQKSRS LRFAILQNDS MNIRKGGAGG DLSDEMPNVP 
LADEQGNPNH ANVSSYVALT GESVNIEDVY EAGAFDFSGT KRYDAATGYR CKSMLVMPLK 
NHEDKIIGVL QLLNAKDPQT GEIMKFHADI VGLVASLASQ AAIALTNTQL IEDLKALFYA 
FIKSIATAID AKSPFTGGHI NRVVSLTMDV AEAIHGTNTG PFGEMRFTDD EMEELRIAAW 
MHDVGKITTP EHIVSKTNKL EGVFDRIHLI ETRFLLILQL MENRHLRVKI DLLKTDNSPA 
ALKKMEAMDR ELQARKAEIL ESLELLKAVN TNKGMVDERA VKQVREIAAR TYHIGGNAYP 
WLSENEAACL SILKGNLLDE ERRLVEQHAE MTINITRELP FPDRFSHVPE YAGAHHEKLD 
GSGYPLGLTG DQIPLQARII AIADVFEALT APDRPYKRPM HISQALKILQ EMAAAGHIDG 
DIVRMFIKQK VYQAYADKEL TPEQLSTA