Gene Moth_1786 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1786
Symbol
ID	3832452
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1839500
End bp	1840885
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	58%
IMG OID	637829711
Product	radical SAM family protein
Protein accession	YP_430630
Protein GI	83590621
COG category	[R] General function prediction only
COG ID	[COG0535] Predicted Fe-S oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.00175459
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAACCTGG CGGCAACCTA TGTCGGTGAA AAGGTACTGG AGCAGGGGGT AAAATTGATT 
CTCAATAATC CCGAAAAAAA TATCCCGCGC CTGATCACCC TGGCCGAAAA ACTGGCGCGG 
GACCCCTACC ACCGGGAGAT GGTAGCCAAC GTTAAGAAAG TACTGGAAAA TAAAGAAGGC 
AACTGGTACC AGTTTGCCCG ACGGTTGCTG ACCACAACCC ATCCCAATAT TCGCCAGCGC 
CTGGCCATGG ATTTTTTTGT TAATTCTACC TTTATTGGCG TACCGCGGCA AAAGGAATGG 
GCGGCGAAAC TGGGAGTGGC AGTGCCCTGG GCCATTCTCA TGGACCCGAC GGAGAAATGT 
AACCTCCACT GCCGGGGCTG CTGGGCCGGC GACTACCAGC GGGCCCGGGA GCTGGATTTC 
GCCACTATGG ACAGGGTAGT TACTGAGGGG GAGAAGCTAG GGATCAACTT TATTGTCCTC 
TCCGGGGGGG AACCCATGAT GCGGCGGGGA GATATTGTTC GCCTGGCAGA GAAACATCCC 
GACCAGGTCT TCCATCTCTT TACCAACGGT ACCCTGATTG ACCGGGCCTT TGTGGACGAC 
ATGGTTCGCC TGGGTAATAT TACCGTAGCC CTGAGCCTGG AAGGTTTTGA GGAAAAGACC 
GACGCCCGCC GGGGTAAAGG CGTTTTCGCC AGGGTGATGC AGGCCATGGA TCTCATGCGC 
GAGGCCGGGG CCGTATACGG GGTCTCGGTC ACCTACAGCC GTAACAATAC CGAGGAACTG 
GGCAGCGAGG AATTTGTAGA TATGCTGGTG GAAAAGGGCG TGGCCTTTGG CTGGTATTTC 
ACCTATATCC CCATCGGCAA GGACGTGGAC TTGGAGATGA TGGCCACGCC GGAGCAGCGG 
GCCTGGATGT TCGACCGCAT CCAGTATTTC CGCCAGACGA AACCCATCTT TCTAGTGGAC 
TTCTGGAACG ACGGCGAGGC GAGCAACGGC TGTATCGCCG GCGGCCGGCG CTACTTCCAC 
ATCAACGCCG CCGGGGAAGT AGAGCCCTGC GCCTTTGTCC ACTACAGTAC CTGTAATATT 
AACCATATCA GCCTGGTGGA GGCCCTGCAG AACCCCCTTT TCCGGGCCTA TCAGAAACGC 
CAGCCTTTTA ATACCAACCT GCGCCGGCCC TGCCCCCTTA TCGACAACCC GGAGATGCTG 
CGGGAGATGG TGGCCGAGGC GGGCGCCCGC TCGACCCAGC TCCACGCTGA CGAGACAGCG 
GAGGAGTTCG CGGCCAAACT GGCCCCCTAC GCCCGGGATT GGGGGGCCAT CGCCGACCGC 
ATCTGGAATG AGGCCGGGAA GGCGGGTAAG ACAGCTGCGG GAGACAGGTG CTGCCAGGCC 
CATTGA

Protein sequence

MNLAATYVGE KVLEQGVKLI LNNPEKNIPR LITLAEKLAR DPYHREMVAN VKKVLENKEG 
NWYQFARRLL TTTHPNIRQR LAMDFFVNST FIGVPRQKEW AAKLGVAVPW AILMDPTEKC 
NLHCRGCWAG DYQRARELDF ATMDRVVTEG EKLGINFIVL SGGEPMMRRG DIVRLAEKHP 
DQVFHLFTNG TLIDRAFVDD MVRLGNITVA LSLEGFEEKT DARRGKGVFA RVMQAMDLMR 
EAGAVYGVSV TYSRNNTEEL GSEEFVDMLV EKGVAFGWYF TYIPIGKDVD LEMMATPEQR 
AWMFDRIQYF RQTKPIFLVD FWNDGEASNG CIAGGRRYFH INAAGEVEPC AFVHYSTCNI 
NHISLVEALQ NPLFRAYQKR QPFNTNLRRP CPLIDNPEML REMVAEAGAR STQLHADETA 
EEFAAKLAPY ARDWGAIADR IWNEAGKAGK TAAGDRCCQA H