Gene Moth_0095 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0095
Symbol
ID	3832666
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	92267
End bp	93703
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	64%
IMG OID	637828027
Product	3-octaprenyl-4hydroxybenzoate decarboxylase
Protein accession	YP_428977
Protein GI	83588968
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0043] 3-polyprenyl-4-hydroxybenzoate decarboxylase and related decarboxylases
TIGRFAM ID	[TIGR00148] UbiD family decarboxylases

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.218951
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGCTCACC AGGATTTGCA GGCCTACCTG GCCTATCTAG AAGCCCACAA ACTGTTGCAT 
CGCGTTAAGG TAGAGGTCGA CCCCATCTTT GAGATTGCGG CCATCAGCGA CCGGGTGGTC 
AAACGGGGCG GCCCGGCCCT GCTCTTCGAG CGGGTAAAGG GTTCGACCCT GCCCGTGGCC 
ACCAACCTCT TCGGCAGTAT AGACTTGGTA AAGGCGGCCC TGGAAGTGAC CGACCTGGAG 
GAACCGGCCC GGCGCCTCCG GGCCCTCCTG GAACTGCCGG CCGATTCGGG TGGCTGGCTG 
GATAAGCTGC GCTTTCTGCC CCGCCTGGCA GAACTGGGCC GTTACCTCCC CCGCCGGGTA 
AAGGAGGCTC CCTGCCAGGA GGTCAGGGTA GAACCGCCAT CTTTGGAGGA ACTGCCGGTA 
CTGCAACTCT GGCCGGGAGA CGGCGGCCGT TTCCTTACCC TGCCCCTGGT CTTTACCCAT 
GACCCCCTGA CCGGCCGCCG GAATGTAGGC ATGTACCGAA TGCAGGTGTT TGACGCGGTC 
ACCACCGGCA TGCACTGGCA TATCCACAAG GACGGGGCCG AGCACCTGCG CCGCAGCGGG 
GACCGCCTGG AAGTAGCTGT CGCCCTGGGA GCTGACCCGG CGGTGATCTA CGCCGCCACT 
GCCCCCCTGC CTCCGGGCCT GGACGAGATG CTCCTGGCCG GGTTTTTACG CCGGGAACCG 
GTGGAGATGG TACCGGCCCT GACGGTGAAT ATCGATGTCC CGGCCCGGGC GGAGATTATC 
CTCGAGGGTT ATGTCGACCC TGGGGAAACC CGCCTAGAGG GCCCCTTCGG CGACCATACG 
GGTTATTACT CCCCGGCTGA CAATTATCCC GTTTTTCACC TGACCTGCCT GACCCGGCGC 
CGCCGGGCGG TTTACCCGGC TACGGTGGTG GGACCGCCGC CCATGGAGGA CGCCTACCTG 
GGGAAAGTAA CGGAACGCCT CTTCCTGCCT TTGATCCAGC TCCAGCTCCC GGAGGTGGTG 
GACATCAACT TCCCCCCCGC AGGGGTTTTC CATAACTGCG TCATTGTCGC CATCCGTAAA 
GCTTACCCCG GCCAGGCGCG CAAGGTCATG CATGCCCTCT GGGGGATGGG GCAGATGATG 
TTTACCAAGC TCATCATCGT AGTCGATGCC GATGTCAACG TCCATGATCT TCAAGAGGTC 
GCCTGGCGCG TCCTGGGTAA TATCGACCCC CGCCGGGATG CCGTTATAGT CGACGGGCCG 
GTGGATATCC TGGATCACGC CGCTCCCCGC AGGGGTTTCG GTAGCAAGAT GGGACTGGAT 
GCCACCCGGA AACTGCCGGA AGAAGGAGCC TCGCGTCCCT GGCCGGAGGA GGCCCGGGCT 
GCCCGGGAGG TCCTGGAACT CATCGACAGG AGGTGGCAGG AGTATGGTCT GGCGTAA

Protein sequence

MAHQDLQAYL AYLEAHKLLH RVKVEVDPIF EIAAISDRVV KRGGPALLFE RVKGSTLPVA 
TNLFGSIDLV KAALEVTDLE EPARRLRALL ELPADSGGWL DKLRFLPRLA ELGRYLPRRV 
KEAPCQEVRV EPPSLEELPV LQLWPGDGGR FLTLPLVFTH DPLTGRRNVG MYRMQVFDAV 
TTGMHWHIHK DGAEHLRRSG DRLEVAVALG ADPAVIYAAT APLPPGLDEM LLAGFLRREP 
VEMVPALTVN IDVPARAEII LEGYVDPGET RLEGPFGDHT GYYSPADNYP VFHLTCLTRR 
RRAVYPATVV GPPPMEDAYL GKVTERLFLP LIQLQLPEVV DINFPPAGVF HNCVIVAIRK 
AYPGQARKVM HALWGMGQMM FTKLIIVVDA DVNVHDLQEV AWRVLGNIDP RRDAVIVDGP 
VDILDHAAPR RGFGSKMGLD ATRKLPEEGA SRPWPEEARA AREVLELIDR RWQEYGLA