Gene Dole_0202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0202
Symbol
ID	5693019
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	222953
End bp	224179
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	64%
IMG OID	641262781
Product	molybdenum cofactor synthesis domain-containing protein
Protein accession	YP_001528089
Protein GI	158520219
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0303] Molybdopterin biosynthesis enzyme
TIGRFAM ID	[TIGR00177] molybdenum cofactor synthesis domain

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCCGGCCT TTGACCGTCG CCTGCTCGAT TACGAGACGG CCCTGGACAC CTGCCTGTCG 
GCGGTAACGG AAAGCCTGCC CGCGGAAACC GTGGGCCTGG AAAAGAGCCT GGGCCGGGTG 
CTGCGCCGGT CCGTGGAAAG CGCTATCTCT GTGCCGCCTT TTGACAAGTC CACCATGGAT 
GGGTATGCCG TGAAATCCGC GGATGTGGCC GGGGCATTGG ACACGGCGCC GGTGGCGCTG 
GAGGTGATCG ACGAGATTCC CGCGGGCCGG GTCTGCGGAA AAATTCTCCG GTCCGGCCAG 
GCGGCCCGGA TCATGACCGG GGCGGCGGTT CCCCAGGGCG CCGACGCGGT GATCAAACTT 
GAAAACACGG CCCCGGCCGG CTCCGAACAG GTTCATATCC TCAGCGGCGT GGAGGAGAAC 
AATTACATTA TTTACAAAGG CCAGGATCTG CTGCCGGGAA GCCGCGTGGC CGAGGCCGGG 
GCAACGGTCA CCCCGTCCCT GCTGGGCCTG CTGGCCAACT GCGGCACCCC GAATGTGTCG 
GTTTCGCGAA AACCGGCCAT CGGCATCATC TCCACGGGCA GCGAGCTGAC GGCGCCGGGG 
ACCCCCCTGG CAGAGGGCCG GATTTACGAT GTCAACAGCT ACCTGCTCTA CGGGCTGTGC 
ATTGAGGCCG GCGGCGATGT CGCCATGCTG GGAACCGTGG AGGACAAAAG CGACGCGCTG 
CTGGCCCTGC TCAACCGGCA CACCGATGCC GACATCCTGA TCCTGTCCGG CGGTGTGTCC 
GTGGGCGACT ACGACATTGT TCACGAAACC CTGCAGCGGG CCGGTGTGGA AGAGATCTTC 
TGGCGGGTGA AAGTCAAGCC CGGCAAGCCG CTGTTCTTCG GCCGGCGGGG TTCCACCCTG 
GTGTTCGGCC TGCCGGGCAA TCCCATCTCA TCGGCCAACA ATTTTTACCT GTTTGTTCTG 
CCGGTCATTC ACAAACTTCT GGGCCGGTCC GCCTGGGGGC TGAAAACCGG TCATGCAACG 
GTCTGCAACA GCATGATTTT CCGTCCGGGC CGGCGAAAAT TTCTGCGCGC CCAGTTGCGG 
CAAGGCCCGG AGCAGGGGGT TTGGATTTTT CCTGAACAGC GCTCCGGCGT GTTTGGTCCC 
ATGGTCGACG CCGAGGTGCT GGTGGAGGTG TCCGAGGCCG CCAAGATGGT CCGGGAAGGG 
GACCCGGTAA AGATTTACTA CCTGTAA

Protein sequence

MPAFDRRLLD YETALDTCLS AVTESLPAET VGLEKSLGRV LRRSVESAIS VPPFDKSTMD 
GYAVKSADVA GALDTAPVAL EVIDEIPAGR VCGKILRSGQ AARIMTGAAV PQGADAVIKL 
ENTAPAGSEQ VHILSGVEEN NYIIYKGQDL LPGSRVAEAG ATVTPSLLGL LANCGTPNVS 
VSRKPAIGII STGSELTAPG TPLAEGRIYD VNSYLLYGLC IEAGGDVAML GTVEDKSDAL 
LALLNRHTDA DILILSGGVS VGDYDIVHET LQRAGVEEIF WRVKVKPGKP LFFGRRGSTL 
VFGLPGNPIS SANNFYLFVL PVIHKLLGRS AWGLKTGHAT VCNSMIFRPG RRKFLRAQLR 
QGPEQGVWIF PEQRSGVFGP MVDAEVLVEV SEAAKMVREG DPVKIYYL