Gene Dole_0157 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0157
Symbol
ID	5692974
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	173580
End bp	174560
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	62%
IMG OID	641262736
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001528044
Protein GI	158520174
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0702] Predicted nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.000218299
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCCATC AAAAAGTTCT TCTCACCGGC CCCACCGGGT TTATCGGCAA GCGGCTGCTC 
TATCAGCTGG ATGAGAGGGG GTATCAGGTC CGGTGCCTGG TAAGGGCCGG CGAAACCCTG 
GACCTGAATC TTCCGCTGCG GCAGGAACCG GAAATCGTTT ACGCGGACCT TCTTGATCCG 
GATTCCCTGC CAACGGCGCT TGACGGTATG GACACCGCCT ACTATCTGGT GCACTCCATG 
GGGGGGAGAA GCATCCGCCA GACCCGGGCC TTTGTGGAAA AAGACCGCAC CGTCGCACGC 
AACTTCAGGG AAGCCGCCGA CCGGGCCGGC CTTTCCCGCA TTATTTATCT CGGGGGCCTG 
GGGGATGCCG GAGACCGGCT GTCCCATCAC CTGGCCAGCC GCCATGAGGT GGCCCGGATT 
CTTCAGGCCG GAAAGGTGAA AACCACCGTG CTGCGGGCCG CGGTCATCAT CGGGGCCGGC 
GGGGCCTCTT TTGAAATTAT TCGGTACCTG GTGGAGCGGC TGCCGGTGCT CCTCGGTCCC 
CGGTGGGTGT ACACCAAATC CCAGCCCATT GCCGTGGAAA ATGTCCTGGC GTATCTTTGC 
GGATGCCTGG AGACCCCGGA AACCGCCGGT CGGACCTTTG ACATCGGCGG CCCCCAGATT 
TTGAGTTATG CCGATCTCAT GGGAATGTAC GCCCGGGTCC GGGGGCTGTC CCGCACCATT 
ATCGGGGTGC CCCTGGTGCC CATCCGGCTT TCCGCCTACT GGGTCCACTT TATCACCCCC 
GTGCCCGTCG GTGTCGTCCT GCCCCTGGCC GAAGGGCTCA GAAACAGGGC CATCTGCCGG 
GAAAACAGCA TTCGGGATCT GATCCCCATT CACCTGACCC CCATGGAAAC CGCCATCTGC 
AATGCCCTTG CCGAAGAAAC AGAAGGCCCG GGAAAATTAT TGTCTCAGCA GGCCTGCTTT 
CTGCCGGGAG ACCTGGCATG A

Protein sequence

MAHQKVLLTG PTGFIGKRLL YQLDERGYQV RCLVRAGETL DLNLPLRQEP EIVYADLLDP 
DSLPTALDGM DTAYYLVHSM GGRSIRQTRA FVEKDRTVAR NFREAADRAG LSRIIYLGGL 
GDAGDRLSHH LASRHEVARI LQAGKVKTTV LRAAVIIGAG GASFEIIRYL VERLPVLLGP 
RWVYTKSQPI AVENVLAYLC GCLETPETAG RTFDIGGPQI LSYADLMGMY ARVRGLSRTI 
IGVPLVPIRL SAYWVHFITP VPVGVVLPLA EGLRNRAICR ENSIRDLIPI HLTPMETAIC 
NALAEETEGP GKLLSQQACF LPGDLA