Gene Dole_1848 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1848
Symbol
ID	5694688
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2234150
End bp	2235163
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	62%
IMG OID	641264446
Product	UDP-glucose 4-epimerase
Protein accession	YP_001529729
Protein GI	158521859
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1087] UDP-glucose 4-epimerase
TIGRFAM ID	[TIGR01179] UDP-glucose-4-epimerase

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAG TGCTTCTGAC GGGCGGGGCC GGTTATATCG GGTCTCACAC GTGCGTATCC 
CTTCTGGAGA GCGGCTGCGA GGTGCTGGTG GTGGACAACC TGTGCAACAG CAGCGCAGTG 
GCCCTGGAGC GGGTAAAGGC CATCACGGGC CGGGCCGTGA TGTTTGAAAA GGTGGACATG 
CGGGACAGGG CCGAACTGGA CAGGGTTTTT AAAACGTTTG CGCCGGACGC GGTGATCCAT 
TTTGCCTGCC TCAAGGCCGT GGGTGAATCC ACCACCGACC CGCTGACCTA TTATGCCAAT 
AACGTGGCCG GATCAGTGGT GCTGTTTGAA GCCATGGAAG CGGCCGGGGT AAAAAACATT 
GTGTTCAGCT CATCGGCCAC GGTGTATGGC GACCCGGAAA CCGTACCGGT GACCGAAGCC 
GCGGCCATTT GTCCCTGCAA TCCCTACGGC CGCACCAAGC GTATGATAGA GGAAATGCTG 
GAGGATATTC ACGCGGCGGG CAAAGGCTGG AACATTGCCA TTCTGCGATA CTTCAATCCC 
GTGGGGGCCC ACGCCAGCGG GCTTATCGGC GAAGACCCCA GGGATGTGCC CAACAACCTG 
GCCCCCTATA TCGCCCAGGT GGCCGTGGGC CGGCGGCAGC AGCTTAATGT TTACGGGGAC 
GACTATCCCA CAAAAGACGG CACCGGCGTG CGGGACTACA TTCATGTGTG CGACCTGGCT 
GAAGCCCATG TAAAGGCCCT TGAAAAGCTG GCCCAGAACC CGGGCCTGGT GACCTACAAC 
CTGGGCACCG GCACCGGCCA TTCGGTGCTG GAGGTGGTGG CCGCCTTTGA ACGGGCCTGC 
GGCCGGCCCA TTGCCCGCAC CGTCACCGGC CGGCGGGCCG GCGACGTGGC CGAATACTAT 
GCCGACCCTT CCCGGGCGGA AAAGGAGCTG GGCTGGAAGG CGCGGCGCAC CCTTGACGAC 
ATGGCGGCCG ACACCTGGCG CTGGCAGTCC GGAAACCCGG AGGGGTACAG GTAA

Protein sequence

MKKVLLTGGA GYIGSHTCVS LLESGCEVLV VDNLCNSSAV ALERVKAITG RAVMFEKVDM 
RDRAELDRVF KTFAPDAVIH FACLKAVGES TTDPLTYYAN NVAGSVVLFE AMEAAGVKNI 
VFSSSATVYG DPETVPVTEA AAICPCNPYG RTKRMIEEML EDIHAAGKGW NIAILRYFNP 
VGAHASGLIG EDPRDVPNNL APYIAQVAVG RRQQLNVYGD DYPTKDGTGV RDYIHVCDLA 
EAHVKALEKL AQNPGLVTYN LGTGTGHSVL EVVAAFERAC GRPIARTVTG RRAGDVAEYY 
ADPSRAEKEL GWKARRTLDD MAADTWRWQS GNPEGYR