Gene Dole_0062 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_0062
Symbol
ID	5692876
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	68641
End bp	69801
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	60%
IMG OID	641262638
Product	uroporphyrinogen decarboxylase
Protein accession	YP_001527949
Protein GI	158520079
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0407] Uroporphyrinogen-III decarboxylase
TIGRFAM ID	[TIGR01463] methyltransferase, MtaA/CmuA family

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.629057
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCTGA TGCAAGTGGG CTACTATCTG AAAAAACGGC AAATCCCCCC CCTGGCCCTG 
ATTCCTGACC CCATTTTGGA CACCCTGGCC GGGGTCTCCA GTTTTCGGGG CCGGTTTCAG 
ACCCTGACCG GGATTGAGCG GGCCCTGACC GCGTTTCGCC ACAAGGAGCC GGACCATGTG 
CCGGTTTCAC CCATCTTGTG CGCCGGTGCC CGGCAGATAT CGGGCATCAC CTTTCCCGAC 
TACGCGCTGG ACGGGGAAAA GGCGGCCAAA GTTTTTATGG ACGGGTACAA TTTTGTGGGC 
GGCGACGCCG TTGTGCTGCT GCTGGACCTC TCCGTTGAGG CCGCCGACTT CGGCCAGGCC 
ATTATCTACC CACTCAACTC CACGCCCATG CCGGACTACA AGAACCCTGT GATCACCCAC 
CACGACCAGT ACCGGGCACT TAAGTCCATT CGGTTTTCCG AGGCAAAACG GATGCAGGAG 
TTTGTAAAAC TCTGCCGTAT CGTGGTGGAA GAGGTGGGCC TGCGGGCCAT TGTATCCGGG 
TTTGTGTTCG GCCCCTTAGG CATTCTGGCC ATGATGCGGG GCGCGGAAAA CCTGTTCAAG 
GAGTGCCGCC TCTATCCAAA AGAGGTGATG GCCGCCTGCG ACACCATCAC CGAAGTGTTG 
GTCGAGTTTG TGCTGGCCCA GTGTGAGGCC GGGGTGCCGG CCATTGCCAT TGACACCCTG 
TTTGCCTCAA GAAGCGGCCT GCCCAAAGAC CTGTGGGAAG AGATCGAAGG CCCCTTTGCC 
GGAGAGATCA GCCGGGCCAT CAAGTCCACC GGCAGGATCG TGGCCATTCA CAACTGCGGT 
GACGCCCCCT ATTTTGACGC CCAGATCCGC TCCATGGACC CGGCCCTGAT CAATTTTTCC 
GAGCTTCCCG ATGACTGCGC CTCCCGCAGG GAGATGAAAG AAAAGTACGG TGACCGCATC 
ACCCTGATGG GCCATGTGCC CACCCCGCTG CTGGTCCACG GATCGCCCCA GGAAGTGATC 
GACGAGTGCA GGCGCCACAT CGACGACCTG GCGCCTGGCG GGGGTTATAT CCTGTCACCG 
GGATGCGAGT ATCCGCCCAA CATCAGCCTG GTCAATGCCT TTGCCCTGAT TCACGCGGCC 
AAAACCCATG GGAGAAAATA G

Protein sequence

MSLMQVGYYL KKRQIPPLAL IPDPILDTLA GVSSFRGRFQ TLTGIERALT AFRHKEPDHV 
PVSPILCAGA RQISGITFPD YALDGEKAAK VFMDGYNFVG GDAVVLLLDL SVEAADFGQA 
IIYPLNSTPM PDYKNPVITH HDQYRALKSI RFSEAKRMQE FVKLCRIVVE EVGLRAIVSG 
FVFGPLGILA MMRGAENLFK ECRLYPKEVM AACDTITEVL VEFVLAQCEA GVPAIAIDTL 
FASRSGLPKD LWEEIEGPFA GEISRAIKST GRIVAIHNCG DAPYFDAQIR SMDPALINFS 
ELPDDCASRR EMKEKYGDRI TLMGHVPTPL LVHGSPQEVI DECRRHIDDL APGGGYILSP 
GCEYPPNISL VNAFALIHAA KTHGRK