Gene Dole_1960 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1960
Symbol
ID	5694800
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2371095
End bp	2372183
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	58%
IMG OID	641264558
Product	CDP-glucose 4,6-dehydratase
Protein accession	YP_001529841
Protein GI	158521971
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID	[TIGR02622] CDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAACC TTTTTCAGAA CGCGTATCAC CGCCGGAGAG TGCTGGTCAC CGGGCATACC 
GGCTTTAAAG GGTCATGGCT CTCCTTCTGG CTTTCGCAAA TGGGCGCCGA TGTGTACGGC 
TACTCCCTGG CGCCCGAGAC CCGGCCCAAT CACTTCTCTC TGCTCAACCC GGGTGACGAA 
ACCCCTGAAA CCGACATCCG GGATATCCGA CAAGTAATTG ACTGCTTTCA GTCCTTTCAG 
CCGGAAATCG TTTTTCACCT GGCCGCTCAG TCCCTGGTGC GCCGGTCCTA CCGTGAACCC 
CTCGACACCT TTGCCGCCAA TGTCATGGGC ACGGCCAACA TACTCGAGGC CTGCCGGCTG 
ACAAAATCCG TGCGGGCCGT GGTGATCGTG ACCAGTGACA AGTGCTACCA GAACAATGAA 
TGGGAATGGG GATACCGGGA GAGCGACCCC ATGGGCGGCC ATGACCCTTA CAGCGCCTCC 
AAGGGGTGCG CGGAACTTGT CACCGCCGCT TTCCGGAATT CTTTTTTTTC TACAGGCACC 
GGCCATCCGG CCCTGATGGC CACGGCCCGG GCCGGTAATG TGATCGGCGG CGGCGACTGG 
GCCGAAGACC GCCTGATTCC GGACGTGGCC CGTGCTTTCA ACAAAAAAGA AACCATGAAA 
ATCCGTAACC CCCATGGACT CCGTCCCTGG CAGCATGTGC TGGAGCCGCT TTCCGGATAC 
CTGATGCTGG GACAACGCCT GATTGAAGGA GACCGGGGAC TTGCCGATGC CTGGAATTTT 
GGGCCGTCGG AAGAAGACAC GCTTCCGGTA ATAACGCTTC TGAAACGGTT AAAAACTCAC 
TGGTCCGACC TGGACTTTGA TGTGGACCAA CAGCCGGACC AGCCCCACGA GGCCGGTCTG 
CTCCGGCTGG ACTCTTCTAA AGCCAGGCGG AAACTTGGCT GGCAACCGGT CTGGAACTGT 
GACCAGGCCC TTGAAAGGAC CGCAGCCTGG TACCAGGCGT TTTACAACCA GGCTACGATT 
CTGACCGGCG CGGATCTGGC GGCCTATATC GAGTCGGCCC GTTCAAAAGG ATTGCCATGG 
GCGCAATAA

Protein sequence

MKNLFQNAYH RRRVLVTGHT GFKGSWLSFW LSQMGADVYG YSLAPETRPN HFSLLNPGDE 
TPETDIRDIR QVIDCFQSFQ PEIVFHLAAQ SLVRRSYREP LDTFAANVMG TANILEACRL 
TKSVRAVVIV TSDKCYQNNE WEWGYRESDP MGGHDPYSAS KGCAELVTAA FRNSFFSTGT 
GHPALMATAR AGNVIGGGDW AEDRLIPDVA RAFNKKETMK IRNPHGLRPW QHVLEPLSGY 
LMLGQRLIEG DRGLADAWNF GPSEEDTLPV ITLLKRLKTH WSDLDFDVDQ QPDQPHEAGL 
LRLDSSKARR KLGWQPVWNC DQALERTAAW YQAFYNQATI LTGADLAAYI ESARSKGLPW 
AQ