Gene Dole_2193 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2193
Symbol
ID	5695039
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2666832
End bp	2667842
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	61%
IMG OID	641264797
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001530074
Protein GI	158522204
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAGTT CAAAACAGAT GGCCCAGCCC GTGCTGGTGA CCGGGGCCAC CGGCTTTATC 
GGCAGCCAGG TGGTTCACAA GCTGCTGGAG CAGGATATGG CGGTCAAGGC ACTGGTGCTG 
CCGGACGAAG CCCTGCCCGC TGCCTGGGGC GACCGGGTGG AAGTGGTACG GGGCGGCATC 
TCGGAGTCCG GGGCTGTGGC AAAGGCCGTT TCCGGAGCCG GGACCATCAT TCATCTGGCC 
GCGGTGGTGT CGGACTGGGG GGATGAAAAA AAATACTGGG AGTTTACCGT GGAGGGCAGC 
CGCCTGGTGT TTGAACAGGC CGCAAAAACC GGAGCCCGGG TGGTGCTGGT CTCCAGTGTG 
GTGGTGTACG GCGACAATGT CCGCAAGCAA GTGTGTCACG AAGATGTGGG TTACGGAAAA 
ACCTTTGGCC CTTACAGCCG CACCAAGCAG GCCCAGGAAA AGCTGGCATG GGAGTACCAC 
AGGAAAAAGA ACCTGGCCCT GACCGTGGTG CGGCCCGGCA ATGTCTACGG ACCGCGTTCC 
GGCCCCTGGC TTCATGACGT GGTCAATGTT TTACGCAGCG GCGCGCCGGG TCTTATCTCC 
GGCGGCAACA TGAACGCCGG CCTTGCCTAC GTGGACAACG TGGCCGACCT GTTCCTCCTG 
GCCGGGGCCA GTGACACGGC CCTGGGCCGG GCCTACAACG CCGCCGACGG AACTAAAGTC 
ACCTGGCGCC GTTATTTTGA GGACATCGCC GCCATGATCG GCGCGAAAAA ACCGGGATCC 
GTACCCCGGC CGGCGGCGGC CCTGAGCGCC TTTGTATTTG AAAAAACATG GAAGCTCTTC 
GGCATTCAGA AACGGCCGCC CGTGACCCGG GACGCTCTGA ACCTGGTGGG ATCGGACAAC 
CGCTTTCCCA TTGACCGGGC CAGGAAAGAA CTGGGCTATG CGCCAAAGGT CTCTTATGAA 
GAGGGGCTGA AGCGGATTCG GGAGTATATT GATAAGGAAA GTATCCGATA A

Protein sequence

MNSSKQMAQP VLVTGATGFI GSQVVHKLLE QDMAVKALVL PDEALPAAWG DRVEVVRGGI 
SESGAVAKAV SGAGTIIHLA AVVSDWGDEK KYWEFTVEGS RLVFEQAAKT GARVVLVSSV 
VVYGDNVRKQ VCHEDVGYGK TFGPYSRTKQ AQEKLAWEYH RKKNLALTVV RPGNVYGPRS 
GPWLHDVVNV LRSGAPGLIS GGNMNAGLAY VDNVADLFLL AGASDTALGR AYNAADGTKV 
TWRRYFEDIA AMIGAKKPGS VPRPAAALSA FVFEKTWKLF GIQKRPPVTR DALNLVGSDN 
RFPIDRARKE LGYAPKVSYE EGLKRIREYI DKESIR