Gene Moth_1912 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1912
Symbol
ID	3830836
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1981394
End bp	1982815
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	63%
IMG OID	637829845
Product	RNA methyltransferase
Protein accession	YP_430755
Protein GI	83590746
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG2265] SAM-dependent methyltransferases related to tRNA (uracil-5-)-methyltransferase
TIGRFAM ID	[TIGR00479] 23S rRNA (uracil-5-)-methyltransferase RumA

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.000000000182205
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACTCGG CTATTACCAT TATCGGGTTA AACCATGAAG GCGCCGGGAT CGGTCATCTG 
CAGGACGGAC GGGTTATCTT TGTGCCCGGA GCCCTGCCGG GGGAACAGGT CCTGGTGGAA 
GTAGTCAGCG TTAAAAGGAA TTACGCCAGG GGTCGGCTGG TAGAGGTCGT AGAGGCGTCG 
CCGGACCGGG TGTTGCCCCC CTGCCCGGAA GCGGCCTCCT GTGGCGGGTG CGATCTGCAA 
CACCTGGACT ATCGGGCCCA GTTGCATTGG AAGCGTCGTC TGGTAATCGA TGCCTTGCAA 
CGCCTGGGAC ATCTGAGGGA TATCCCGGTG CTACCCGTTC TGGGTATGGC TAATCCCTGG 
GGTTACCGCA ACAAGGTGCG GCTGCATGTC CGCCGGGGGC GGCTGGGCTT TTACCGCCCG 
GGAAGCCACG AGTTAGCACC CTTCTCCTGC TGTCCATTGT TACCCCCCGG CCTTCTGAAG 
GCGGCCCGGG CGATCGTGCG GTTGCTGCCG GAACTGCCAC CCGGCCTGCA GCATGTAACC 
CTGCGCCAGG GCCTGGCTAC CGGGGAACTG CTGGTTGTCC TGGAGGCTTT ACCTGGATGG 
CAGGGCGATA GGGAACTGGC GGAGAAACTG GCCGGCAGAT TCCCGGAACT GGTGGGGGTT 
GTATCCCTGG CTGGCGGCGG CAGGAGCAGG AGCGGTCCAA AGGATTTTGC CGGGGAGCCT 
GCTTTAGAGT GCAGCGGCTG GGTAAAAACA GGCGGGAAAG AAGCAAGGCG GGCCCGGTAC 
CAGGAAGGAT TCGTGCCCCG CAGGCTAGGT GGCCGGCCCT TCACCCTCTA TGGCCGTGAT 
TACCTGGAGG AACGCCTTGG TGACCTCCGC TTCTATATAT CAGCCACGAC CTTTTTCCAG 
GTTAATTCGG CCCAGGCGGA AGTCCTCTAT AACAAGGCGG CAACCTTTGC CGGCCTGCAG 
GGCGGGGAAG AGGTTCTGGA CGCCTACTGC GGCAGCGGTG CCATTGCCCT GTGGCTCAGC 
CGCCAGGCCG GGCGGGTGGA GGGGGTGGAA GTAGTCCCGG AGGCCATTGT TGACGCCCGG 
CGCAATTCAA TTTTAAACAA CCTGGCCAAT GTCCACTTTC GTACCGGCGC TGCCGAGGCG 
GTCCTGCCCC GCCTGGCAGG AAAGGGTTAC CGGCCGGAGG TAATTATCCT GGATCCGCCC 
CGGGCCGGAT GCGACCGCCG GGTGCTGGCG GCCGTGGCGA CTATGGAACC CCGGCGGGTG 
GTCTACATCT CCTGCAACCC GTCAACTTTA GCCCGCGACC TGGCACACTT ACGGGAAGCT 
GGCTTTAAGC CCGGCCCGGT GCAGCCGGTG GACATGTTCC CCCATACCCA CCATGTGGAG 
TGTTGCTGCT TTCTTGTAAA GGAGAGAAAT AACAGCCGCT GA

Protein sequence

MDSAITIIGL NHEGAGIGHL QDGRVIFVPG ALPGEQVLVE VVSVKRNYAR GRLVEVVEAS 
PDRVLPPCPE AASCGGCDLQ HLDYRAQLHW KRRLVIDALQ RLGHLRDIPV LPVLGMANPW 
GYRNKVRLHV RRGRLGFYRP GSHELAPFSC CPLLPPGLLK AARAIVRLLP ELPPGLQHVT 
LRQGLATGEL LVVLEALPGW QGDRELAEKL AGRFPELVGV VSLAGGGRSR SGPKDFAGEP 
ALECSGWVKT GGKEARRARY QEGFVPRRLG GRPFTLYGRD YLEERLGDLR FYISATTFFQ 
VNSAQAEVLY NKAATFAGLQ GGEEVLDAYC GSGAIALWLS RQAGRVEGVE VVPEAIVDAR 
RNSILNNLAN VHFRTGAAEA VLPRLAGKGY RPEVIILDPP RAGCDRRVLA AVATMEPRRV 
VYISCNPSTL ARDLAHLREA GFKPGPVQPV DMFPHTHHVE CCCFLVKERN NSR