Gene Moth_0831 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0831
Symbol
ID	3831528
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	861378
End bp	862712
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	58%
IMG OID	637828761
Product	radical SAM family protein
Protein accession	YP_429691
Protein GI	83589682
COG category	[C] Energy production and conversion
COG ID	[COG1032] Fe-S oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.00311604
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.515432
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATCG CCTTGATTGC TCCGGCCTGG CACGACCCCC TCTGGGAAAG TGAAAAGGAA 
AAGTCTATCT TCCCGCCCCT GAATCTCATC ACCCTGGCAG CCATGACGCC ACCCCAGCAT 
GAGGTGACTA TCCTGGATGA GAGTTTAACC GATCTCGACT TCAATGAGAA GTACGACCTG 
GTCGGCATCT CGGCCATGAC AGCCCTGGCA CCTCGCGCCT ACGAGATCGC CGATGCCTTC 
CGGGAAAGGG GTACCATGGT GGTCCTGGGT GGTATGCACC CCTCCGCCCT GCCGGAGGAA 
GCCATCGCCC ACGCCGATGC CGTCGTGGTC GGCGAAGCCG AGGGTTCATG GCAACGGCTC 
CTGACCGACC TGGAAAACGG CCAGTTGCAA GCCTTTTACC GCCAGGAAAA GCGCCCTTCC 
CTGGAACATA TGGTTATCCC CCGCCGGGAC CTCTTACAAA GGAGTCGCTA CCTGGTTCCC 
GACACCGTCC AGACTACCCG TGGCTGTCCC TTCGCCTGCT CCTTCTGCTC CGTCAGCCAG 
TTCTTCGGCC ACAGCTACCG TTTTCGTCCG GTAGAAGAAG TCATCAGCGA AGTCCGGGAC 
CTGGAGGGCG AGGTAATTGC CTTTATTGAC GACAATATTG TCGGTAATCC CGCCTACGCC 
CGCCGCCTCT TCACCGAGCT GGCCCGCTTA CCGCGCAAAG TAAAATGGTT TAGCCAGGGG 
TCCTTAAATA TCGCCCGGGA CGAGGAATTA TTGCGGCTCG CCGCCGCGAG CGGCTGCATC 
GGTCTTTTTA TCGGCTTTGA ATCCCTTTCC CCTGCCAACC TCAAGGCCGT CGGCAAAAGG 
GTAAACCTGG TGGATGATTA CCGGCAGGCC ATTAAGAAGC TTCATGACCA CGGCATTGCC 
ATTGAAGGCG CCTTTGTCTT CGGCCTTGAC GAGGATGACG AAAGCGTCTT TGAACGCACC 
GTCAAATTCG CCCAGGAAAA TCGCCTGGAA GCCGCCCAAT TCGGCATCCT GACCCCCTTC 
CCGGGAACCC CCTTAAGGGA GGCCCTGGAA CGTGAGGGGC GCATCACCAA TAATGACTGG 
AGCGAGTATA CCATCAGCAA GGTAGTCTTT GAACCGAAAA ACATGAGCGC CCGGACCCTC 
CAGGAAGGCT TTAACTGGGC CTGGCAGGAA TTCTACTCCC TGGGTTCCAT CTCCCGTCGC 
CTGGGGTTGG CCAAGAAGCA CGCCGCCATC CTCTGGGCCC TGAATCTGAA CATCCGCAAG 
CGGTTTAACC ATTTTATGGA AAGACTCCGG GCGGGGAACC TCGGCCTACC CCAGCCCTCC 
CTGGCCAGGC AATGA

Protein sequence

MKIALIAPAW HDPLWESEKE KSIFPPLNLI TLAAMTPPQH EVTILDESLT DLDFNEKYDL 
VGISAMTALA PRAYEIADAF RERGTMVVLG GMHPSALPEE AIAHADAVVV GEAEGSWQRL 
LTDLENGQLQ AFYRQEKRPS LEHMVIPRRD LLQRSRYLVP DTVQTTRGCP FACSFCSVSQ 
FFGHSYRFRP VEEVISEVRD LEGEVIAFID DNIVGNPAYA RRLFTELARL PRKVKWFSQG 
SLNIARDEEL LRLAAASGCI GLFIGFESLS PANLKAVGKR VNLVDDYRQA IKKLHDHGIA 
IEGAFVFGLD EDDESVFERT VKFAQENRLE AAQFGILTPF PGTPLREALE REGRITNNDW 
SEYTISKVVF EPKNMSARTL QEGFNWAWQE FYSLGSISRR LGLAKKHAAI LWALNLNIRK 
RFNHFMERLR AGNLGLPQPS LARQ