Gene Moth_2100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2100
Symbol
ID	3832466
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2192178
End bp	2193230
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	59%
IMG OID	637830025
Product	methyltransferase MtaA/CmuA
Protein accession	YP_430935
Protein GI	83590926
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0407] Uroporphyrinogen-III decarboxylase
TIGRFAM ID	[TIGR01463] methyltransferase, MtaA/CmuA family

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCGCCA GCGAGCAAAT GGCAGGTAGT GAGAGGGTGA TAGCAGCCGT GCAGGGGCAG 
GAGGTTGACC GCTTCCCCCT GGTTACGCCG ACCTCGGTGG TGACGGTAGA AAGCATGACC 
GTCACCGGTG TTTATTTCCC GGAGGCCCAC ACCGACCCCT ATAAAATGGC CGCCCTGGCT 
GCGGCCGGCC ACGAATTACT GGGCTTTGAT ACCGTCACCC CTTATTTCAG CATCCTGCTT 
GAGGCGGCGG CCCTTGGGTG CGAAGTGGAC TTGAACTCGG TGGACGCCAT GCCAGCCATT 
AAAATTAACC CTCTGAAGAA CCTTTTGGAG AGGAAGTGGG ACTGGCGCCC GCCTGCCAAT 
TTCCTGGATC GGCAACCGGT AAAAGCCCTC CTGGCTGCTA TCAGACTATT AAAAAAGCGC 
TATGGCAGGC GCGTGGCCGT GGTGGGTAAG GTGATCGGCC CCTGGACCCT GGCTTACCAT 
CTGTGCGGGG TTCAGGACTT CCTCCTAGGG CTGGTTCTGG AACCGGAAGC CGTCCGGGAA 
CTCTTAGAGC GGTTGCTGGC CGTTCCTTTG CGTCTGGCAG TAGCTGAGAT TGAAGCCGGG 
GTTGATGTCC TCACCTGGGC TGATCACGCT ACCAGCGACC TGGTCAGCGC TGCTGCTTAC 
CGGGATTTTC TCCTGCCTCT CCACCAGAGG GCTATGGAGC AATTAGCCGG TAGTTGTCCG 
GTGATTTTGC ATACCTGTGG CCGGGCTACC GACCGGGTGG CTTATTTCGC CCGGGCTGGG 
TTTACCGCCT TTCATTTTGA CTCCCGCAAC CCGGTCGGCG ATCTTCTGTC CCTGGCCAAT 
GGCCGGTTGA ATCTCATCGG TGGCATCAAC AACCCCCAGA CCTTGCTGAA CGGTAAAGTG 
AAGGAAGTTA GAGCAACCAT CGAAGGCCTG TTACAGGCGG GTATCAAGAT GGTAGCCCCG 
GAATGCGCCG TGCCCCTGCG GACACCCAAC CAGAACCTCC GGGCCATAGT TCAGGCGGTG 
CGCGACTTCA GCCGCCGCCA CCGGAAGGTT TGA

Protein sequence

MSASEQMAGS ERVIAAVQGQ EVDRFPLVTP TSVVTVESMT VTGVYFPEAH TDPYKMAALA 
AAGHELLGFD TVTPYFSILL EAAALGCEVD LNSVDAMPAI KINPLKNLLE RKWDWRPPAN 
FLDRQPVKAL LAAIRLLKKR YGRRVAVVGK VIGPWTLAYH LCGVQDFLLG LVLEPEAVRE 
LLERLLAVPL RLAVAEIEAG VDVLTWADHA TSDLVSAAAY RDFLLPLHQR AMEQLAGSCP 
VILHTCGRAT DRVAYFARAG FTAFHFDSRN PVGDLLSLAN GRLNLIGGIN NPQTLLNGKV 
KEVRATIEGL LQAGIKMVAP ECAVPLRTPN QNLRAIVQAV RDFSRRHRKV