Gene Moth_0808 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0808
Symbol
ID	3832139
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	838139
End bp	839275
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	64%
IMG OID	637828739
Product	geranylgeranyl reductase
Protein accession	YP_429669
Protein GI	83589660
COG category	[C] Energy production and conversion
COG ID	[COG0644] Dehydrogenases (flavoproteins)
TIGRFAM ID	[TIGR02032] geranylgeranyl reductase family

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0000424296
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGCAATACG ATGTTTTAAT CTGCGGCGCC GGCCCGGCCG GGAGCACCTG CGGTCGCCTG 
CTGGCTCGCC AGGGTCTTAA GGTGGCCATA TTTGACCGGG CGCGCTTTCC CCGTTATAAA 
CCCTGTGGCG GCGGTTTGAC CGGTAAAGCC CAGGGTGAGC TGGAAGCGGG TTGGGAAGAC 
TTAATAGAAG ATACTACCCG TGAAGTTATT TTTTACCATC GCCAGGAACG TCCCCTAAAG 
ATAACCTGCG AGCAGCCGGT AATAAAAATG GTCAGCAGGG AAAAGTTCGA TTCCTGGCTT 
CTCACAGAGG CAGCCAGGGC CGGAGCCGAG GTCAGGGACG GCTACCGGGT GACCGGAGTG 
ACGGAAACAG CCGGGGGGGT GAAGGTTCAA GGGCAAGACG GCTGCACCTG GGAAGGACGC 
TTCCTGGTCG GGGCCGACGG CGCCCTGAGC CTGGTGCGGC GCAGCCTCCC CTTTAAACCC 
GGGGGAACGG CCGGAATAAC CCTGGAGTGC GAAGTGCCGG TTGACGCCGG CCTCCTTACG 
AGTTATCGGG GCCAGGTCCA CCTGAGCTAT GGAGGTATTC CTTACGGCTA CGGCTGGGTC 
TTTCCCAAGG GGGACCACCT CTCGGTGGGA ATAGGCTCCT TTACCCGCCG GGTCAAAGGC 
CTGAGGCGCT ACTTCGATAC CTTTTGTCGC GGGCTGGGGT TGGCGGTGCC GGCGAACTTA 
CGCTGTCGCG GCGCGGTTAT CCCGGCGGCC GACGGCCAGG CGGGCGTCTT TCACACCGGC 
CGGGCCCTCC TGGTGGGGGA TGCCGCAGGC CTGGTGGATC CCTTCTCCGG GGAGGGAATT 
TACTATGCCC TCCGGAGCGG CCGCCTGGCG GCGGAAACCA TCATGGCAAC CCTGGCAGGT 
ACCGGGGAGC CGGGGGCTTA TTCCCGCCGG CTCTACGATG AATTATTACA GCCCCTCCAC 
TACGCCCGGC GCATCGCCAG GGTGGTTTAT GCCCTGACCC CGGTGGTCCA TCGCCTGGTG 
ACGGCCAACC CCGGGATAGC CAGGCGCCTG GTGGAGGTCC TCTTCGGCCG GGATACCTAC 
CCCGACCTCT GGCAGTACCT GACCCGGCGC TACGCCATCT TTCGCCTGGC CCGCTAA

Protein sequence

MQYDVLICGA GPAGSTCGRL LARQGLKVAI FDRARFPRYK PCGGGLTGKA QGELEAGWED 
LIEDTTREVI FYHRQERPLK ITCEQPVIKM VSREKFDSWL LTEAARAGAE VRDGYRVTGV 
TETAGGVKVQ GQDGCTWEGR FLVGADGALS LVRRSLPFKP GGTAGITLEC EVPVDAGLLT 
SYRGQVHLSY GGIPYGYGWV FPKGDHLSVG IGSFTRRVKG LRRYFDTFCR GLGLAVPANL 
RCRGAVIPAA DGQAGVFHTG RALLVGDAAG LVDPFSGEGI YYALRSGRLA AETIMATLAG 
TGEPGAYSRR LYDELLQPLH YARRIARVVY ALTPVVHRLV TANPGIARRL VEVLFGRDTY 
PDLWQYLTRR YAIFRLAR