Gene Moth_1209 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1209
Symbol
ID	3832976
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	1247606
End bp	1249036
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	57%
IMG OID	637829142
Product	methanol:corrinoid methyltransferase
Protein accession	YP_430066
Protein GI	83590057
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000000596998
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTACA AGCCTGTTAA AACCTTTAGT GAACTGGAGG TCAAATCCCT GGATGATTTC 
GTCTACGGGA TTGCGCCCCA TCCCGTAAAA GCAAAGAACG GCATGGTGAT CGGCGCAGGG 
ACGGTTTACC CCGAGATCAA CATGACCCTC CCGCCGATGA ATATTGAGGA AAGCACCATG 
CCCGAAGTCA GAAGGCAGTA TGCGGAGATG ATTGAGGGGA TTTTAAAGAG GGCGAGGGAC 
CTGTACGCCC CCGGCATCAT CGTGGAACTG GAACTGCTCC CGGAGACTAC CATGAAGCCC 
GAGTGGGGGA TCGAGATTAA CAAGATCCTG CGGGACAAGA TGCACGAGTA CGAGGATAAG 
TACGGGCTAA AAAGCCTCCT CAGGTGTACC CCCAACGACA CCAGGGAGAT TCTCAGGCCG 
CCGCTGATGA AACGGGGCGA ACTCCTGGAA AACATGTTCA TCACCTTTGA GAAATGCGCC 
GAGGACGGGG CTGATATCCT TTCCATCGAG TCCACGGGCG GTAAGGAGGT CCACGATGAA 
GCGCTTGTCA CCTGCAACAT CAGGAAGGCC ATCTTTGCCC TGGGTGTCCT GGGGGTCAGG 
GACATGCGGT TCCTCTGGTC CAATATAGTC AGGATCGCCG AACGGACCGG CGCTATAGCC 
GGTGGAGATA CGGCATGCGG GTTTGCTAAC ACCGCCCTCG CCCTGGCGGA ACAGGGAATG 
ATCCCCAGGG TGTTTGCGGC AGTGGACAGG GTGGCCACCA TCCCCAGGAG CCTGGTGGCA 
TTCGAAATGG GTGCCATAGG GCCTGATAAG GACTGCGGCT ATGAGGGGCC ATACATGAAA 
GCCATCGCCG GGGTACCCAT TTCCATGGAA GGCAAAACGG CGGCATGTGC CCATTTAAGT 
GCCATCGGCA ACATCGCCGC CTGTGTGTGC GACATGTGGA GCAACGAATC CGTCCAGAAC 
GTCAAGCTGC TGAGCGCTCC GGCACCCGTG GTATCCACGG AACAGCTCAT CTACGACTGC 
CGGCTGATGA ACGAAGCGGC GGCGGACGGG CGCAGCTTCG CCCTGAAGAT GCGGGACTGG 
CTGGCAGCCT CCGATTCCAG GCTGGATCCC CAGGCCTACG TCCTGAGGCC GGACATAGTG 
CTGGAGATCA GCCAGGAATT GGTTAAGGAA AAGGACGCTT TCATTGCGAC CAAAAAGGCG 
GCCGCCCTGG CGGCGGAGGT CATTAAGCGG GGCCTGGCCC GGGGCGAAGT TCAGGTGTCC 
TCCAGAGAGA AGAAGTGGTT GGACATCATC AGCTCCCAGA TTGAAACAAT ACCCGACGAT 
TGGGAAGAGT TCTGGTACGA AATACAAAAA GAACTGGACC TCGAAAAATT TAGGCCGGAG 
GAATATGATT TAGAGGTAAT CATGGCCAGA GGAGCTTCCG CAGGGAATTA G

Protein sequence

MDYKPVKTFS ELEVKSLDDF VYGIAPHPVK AKNGMVIGAG TVYPEINMTL PPMNIEESTM 
PEVRRQYAEM IEGILKRARD LYAPGIIVEL ELLPETTMKP EWGIEINKIL RDKMHEYEDK 
YGLKSLLRCT PNDTREILRP PLMKRGELLE NMFITFEKCA EDGADILSIE STGGKEVHDE 
ALVTCNIRKA IFALGVLGVR DMRFLWSNIV RIAERTGAIA GGDTACGFAN TALALAEQGM 
IPRVFAAVDR VATIPRSLVA FEMGAIGPDK DCGYEGPYMK AIAGVPISME GKTAACAHLS 
AIGNIAACVC DMWSNESVQN VKLLSAPAPV VSTEQLIYDC RLMNEAAADG RSFALKMRDW 
LAASDSRLDP QAYVLRPDIV LEISQELVKE KDAFIATKKA AALAAEVIKR GLARGEVQVS 
SREKKWLDII SSQIETIPDD WEEFWYEIQK ELDLEKFRPE EYDLEVIMAR GASAGN