Gene Dole_1010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1010
Symbol
ID	5693845
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	1188981
End bp	1190030
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	57%
IMG OID	641263607
Product	dTDP-glucose 4,6-dehydratase
Protein accession	YP_001528897
Protein GI	158521027
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1088] dTDP-D-glucose 4,6-dehydratase
TIGRFAM ID	[TIGR01181] dTDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.626547
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTAAAAA GTGATTTGCA GAAGAAAACG ATTCTTGTCA CCGGCGGCGC CGGTTTTATC 
GGTACCAATT TTATCTATCA CGCCCTGGAT GCAAGTTTCC AGTGTCGGAT TGTTAACCTG 
GATGCGCTTT TGTGTGGCGG CAATGCCTCC AATCTTGACC GGCTGCCGGA CCCTGCCAGG 
TCGCGATACC GGTTTGTGCG CGGTAAGGTT CAGGACGGTG CCCTGCTGGA CCGGCTTTTT 
GCCGAAGAAC AGTTTGCCGG TGTGTTTCAT TTCGCGGCCC AGACCCACGT GGACCGCTCC 
ATCACCGATC CCGGGGATTT TGTTGAATCC AATGTGGTGG GGACTTTTCG CCTGCTGGAT 
ACATGTCTCA AGTACTGGCG CCGGGGTGCT CTGGATCCTG ACTTTCGCAT GGTTCATGTC 
TCCACGGACG AGGTGTATGG CAGCCTGGGC AGTGAAGGGC GCTTCTCCGA AACCAGCCCT 
TACGATCCCT CCAGCCCCTA CTCTGCGTCA AAGGCGGGTT CGGACCATCT GGTCAAATCC 
TATGTGCGGA CCTATGGATT GCCGGCCATG GTGACCAACT GCTCCAACAA TTTTGGCCCC 
TACCAGTATC CTGAAAAACT GATTCCCCTG ATGATTGCCA GTATTCTAAA CGAAGAACCG 
CTCCCGGTTT ACGGGGATGG CAAAAATGTC CGGGACTGGC TCTACGTGCT GGACCACTGC 
GAGGCCCTGA TGCGGGTGTT TGAGGCCGGC CGGCCGGGGG AGAGTTACAA CATCGGCGGA 
GGACAGGAGT ATGAGAACAT CGAACTGGTA CACATGCTTT GCGACCTGGT GGACACCCGG 
CTGGGACGTC CCGAGGCGCA AAGCCGTCGT CTGGTCCGGT TTGTCACCGA CCGGCCGGGC 
CATGACCGGC GGTACGCCAT TGACGCATCA AAAATCAAAC ACGCCCTGGA CTGGAGCCCC 
CGGCACGATT TTACCCGGGC CCTGGACCAG ACCGTGACAT GGTACCTGAG CAACCGGCAG 
TGGCTGACAG GCGGCAAGCA GGATCAATAA

Protein sequence

MVKSDLQKKT ILVTGGAGFI GTNFIYHALD ASFQCRIVNL DALLCGGNAS NLDRLPDPAR 
SRYRFVRGKV QDGALLDRLF AEEQFAGVFH FAAQTHVDRS ITDPGDFVES NVVGTFRLLD 
TCLKYWRRGA LDPDFRMVHV STDEVYGSLG SEGRFSETSP YDPSSPYSAS KAGSDHLVKS 
YVRTYGLPAM VTNCSNNFGP YQYPEKLIPL MIASILNEEP LPVYGDGKNV RDWLYVLDHC 
EALMRVFEAG RPGESYNIGG GQEYENIELV HMLCDLVDTR LGRPEAQSRR LVRFVTDRPG 
HDRRYAIDAS KIKHALDWSP RHDFTRALDQ TVTWYLSNRQ WLTGGKQDQ