Gene Moth_1074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1074
Symbol
ID	3833187
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	1105321
End bp	1106619
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	56%
IMG OID	637829002
Product	hypothetical protein
Protein accession	YP_429931
Protein GI	83589922
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0621] 2-methylthioadenine synthetase
TIGRFAM ID	[TIGR00089] RNA modification enzyme, MiaB family [TIGR01125] MiaB-like tRNA modifying enzyme YliG, TIGR01125

Plasmid Coverage information

Num covering plasmid clones	51
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTAGAG TTGCTGTTAT AACCCTCGGT TGTCCTAAAA ACCAGGTAGA AAGCGAATAT 
ATGCTGGGGA TCCTGGAAAA GAACCACCTG GAAGTGGTAA GCGATCCCCG GCAGGCGGAA 
GTAGTAATCA TTAACACCTG CAGCTTTATT ACCGCGGCAC GGGAAGAGGC TTTAGATACG 
ATCCTGGAGC TGGCCCGGGC TGCCAATCAC CCGCGGTTAA TTGTTGCCGG TTGCCTGGCC 
CAGCAATACG CCTCCGAGTT GTGGCAGGAA TTGCCGGAGG CGGCAGCCTT TATCGGACCC 
GGGGCCACAG GCCGCTTGCC GGAAATTATT AACCGGGTAT TAAAGGGTGA GAGGGTGCTG 
GATGTACCCG GCCCGGAAAT GATTACCGGG GAATTGCCAC GCCTTATCGA AGATGGGAAG 
CCCTTTGCCT ATTTAAAGAT TGCCGAGGGT TGCAATAACC GTTGTACTTA CTGTACTATC 
CCTTCCATCA AGGGGCCCTA TCGCAGCCGG CCCCTGGAGA AAGTGGTAGC CGAGGCCGTT 
TCTCTGGCGG CCAGGGGCAT AAAAGAGCTG GTCCTGGTAG CCCAGGATAC CACGGCGTAC 
GGCCTGGATT GTTACGGAGA GTACCGCCTG CCGGAACTCC TGCGCCGCCT GGCCAGGATT 
GAGGGGATAG AGTGGGTGCG TCTACTCTAC GCCTACCCGA CCAGGATCAC CCCGGAATTG 
ATCGAGGTAA TGGCTACTGA GCCCGGGGTG GTACCTTACC TGGATCTACC CCTGCAGCAT 
GCCAGTGAAG GCGTCTTGAG ACGAATGGGC CGTCCCGGGA CGGGAGCGGC GGGCCTGAGA 
GCTATAGAAA GCCTGCGGCG GGCCATACCG GAGATAACCA TACGCTCTAC CTTTATCGTG 
GGCTTTCCCG GAGAGGAAGA GGAGGATTTT CAAATCCTTC TTGACTTCCT TACTGACGCC 
CGGTTGGACT GGGTGGGGGC TTTTAAATTC TCTCCCGAGG AAGGTACAAT AGCGGCGAGC 
CTTCCAGGTC AGGTACCAGA AGAGGTGAAG GAAGAACGTT ACCAGAGGTT AATGCTCCAC 
CAGCAATCCA TCACCAGGGC CTGCAATGAA GGCTGGCTGG GCCGGGAGGT CCAGGTTTTG 
AAGGAAGGGC CGGAGGTAGG GCGCAGTATG CGCCAGGCCC CGGAAGTAGA CGGTGTGGTA 
TATGTTAAGG GAGATCCCTC ACCAGCCGGT AGCATGGTTA CAGTGAAGCT GACCCAGCTT 
TATAATATCT ATGACTTTCT GGGGGAGATT AAGTTATGA

Protein sequence

MIRVAVITLG CPKNQVESEY MLGILEKNHL EVVSDPRQAE VVIINTCSFI TAAREEALDT 
ILELARAANH PRLIVAGCLA QQYASELWQE LPEAAAFIGP GATGRLPEII NRVLKGERVL 
DVPGPEMITG ELPRLIEDGK PFAYLKIAEG CNNRCTYCTI PSIKGPYRSR PLEKVVAEAV 
SLAARGIKEL VLVAQDTTAY GLDCYGEYRL PELLRRLARI EGIEWVRLLY AYPTRITPEL 
IEVMATEPGV VPYLDLPLQH ASEGVLRRMG RPGTGAAGLR AIESLRRAIP EITIRSTFIV 
GFPGEEEEDF QILLDFLTDA RLDWVGAFKF SPEEGTIAAS LPGQVPEEVK EERYQRLMLH 
QQSITRACNE GWLGREVQVL KEGPEVGRSM RQAPEVDGVV YVKGDPSPAG SMVTVKLTQL 
YNIYDFLGEI KL