Gene Dole_2404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2404
Symbol
ID	5695252
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2894699
End bp	2896000
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	59%
IMG OID	641265010
Product	glucose-methanol-choline oxidoreductase
Protein accession	YP_001530285
Protein GI	158522415
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACACCA CCCAGCATTA CGACGCCATT ATCGTCGGGT CAGGCCCCGG CGGGGCAACC 
GTGGCCAGGG AACTGACAAA GCAGGGCAAA AAGGTCCTGA TTCTGGAATG GGGCAGCAAC 
GCGCCGATAA AGGGGTCCAT GTTCCAGATG GCCCTGAATG CCGGCATGCC CGGCAAAAGC 
GTGCTGTTTA CCAACAAAAA GATGCTGGCC ATGGTGAGAG GGATCTGCAC CGGCGGCAGT 
TCTGTTTTTT ACTGCGGTAC CGCCTTTGAT CCGCCGTATG AAATGATGCG GTCCCACGGC 
ATTGAACTTG AAGAGGAAAC GGCGGCGTTA AAAAAGGAGC TGCCTATTGC CCCGGCCGGT 
GACGCCATTT TCGGCCCGGG CGCCCGCCGC ATGATGGAAA GCGCCCAGGA AATGGGCTAT 
GACTGGAAGC CACTCAACAA GTTCATCTAC CAGGACAAGT GCAAGCCCGA CTGCTGGAAG 
TGCAGTTACG GATGCCCGGA AGGTGCCAAG TGGAGCGCCC GCATGTTCGT GGAAGAGGCC 
GTCACCGATG GCGCTGAACT GATCAACGGC GCAAAGGTGA CCCGGGTGCT GTTTGACGGC 
AACACCGCCA CCGGCGTGGA ATACAAAAAG AACCTGGGCA CCCACAAGGT CACCGCCGAC 
CGGGTCGTCA TCTCCGCCGG CGGGGTGGGG TCTCCCACCA TTCTCCGGGC CAGCGGCATT 
TCCCGGGCCG GCTACGACTT TTTCTTTGAC CCCCTGATCA TGGTATTCGG CACGGTAAAA 
AACCTCAAGG GCAAAGGCGA AATCCAGATG GCGGCCGGTG CCCACATGGC CGACGAGGGG 
TACCTGATGG TGGACCTGGA TTTTCCCTGG CCCATGTACA TGGTGCAGAG CGCGCCCAAG 
CTGCGGCTGC ACAAACTTCT CTCCAGGCGC GATACCCTGA TGCTGATGAT CAAGATCAAG 
GATGACCTGG GGGGCCGCAT CACCGACGGC GGTGGGGTCC GCAAGGACAT CACGAAAAAC 
GACAAGGCCA AACTGCAAAA AGGATATGAA CGGGCAAAAG GCATTCTGCA GAACGCCGGA 
GCTAAAGGGG TGTTTTCCGG CTGGACCGTG GCGGCCCACC CCGGCGGCAC GGTCAAGATC 
GGTGACGTGG TGGATTCGAA CCTGAAAACC GAAAAGGAGA ATCTCTACGT GTGCGACTGT 
TCGGTGATGC CGGATGCCTG GGGCATTCCC CCCACCCTCA CCCTGCTGGC CCTGGGTAAG 
CGGCTGGCAA AGCATTTGGG AGAGGAAATG GACGCAAAAT AA

Protein sequence

MNTTQHYDAI IVGSGPGGAT VARELTKQGK KVLILEWGSN APIKGSMFQM ALNAGMPGKS 
VLFTNKKMLA MVRGICTGGS SVFYCGTAFD PPYEMMRSHG IELEEETAAL KKELPIAPAG 
DAIFGPGARR MMESAQEMGY DWKPLNKFIY QDKCKPDCWK CSYGCPEGAK WSARMFVEEA 
VTDGAELING AKVTRVLFDG NTATGVEYKK NLGTHKVTAD RVVISAGGVG SPTILRASGI 
SRAGYDFFFD PLIMVFGTVK NLKGKGEIQM AAGAHMADEG YLMVDLDFPW PMYMVQSAPK 
LRLHKLLSRR DTLMLMIKIK DDLGGRITDG GGVRKDITKN DKAKLQKGYE RAKGILQNAG 
AKGVFSGWTV AAHPGGTVKI GDVVDSNLKT EKENLYVCDC SVMPDAWGIP PTLTLLALGK 
RLAKHLGEEM DAK