Gene Moth_0246 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0246
Symbol
ID	3833209
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	249030
End bp	250163
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	62%
IMG OID	637828182
Product	peptidase M23B
Protein accession	YP_429124
Protein GI	83589115
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0739] Membrane proteins related to metalloendopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	56
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCGTCGCA AAGCCACAGC GCTGCTCCTG ATGGCTGCCC TTGCCCTGGG CACCGTGCCG 
GCCCACGGCG CCAGTGTAGA TGACCTGCAG CGACAGCAGC AGCAACTGCA GCAGAACATC 
CAGGAACAGC AGAAACTCCT GCAGCAGAAA AACGACGAAG GAGAGGCCCT GCTGCAGCAA 
CTACAGCAGA TCGAGGAGGA TATCCGGCAG AAACAGGCCC AGATAGCCAG CCTGGACCAG 
CAGCTGGCAG CGGCCCAGGG ACGGGTCCAG CAGGTCGCTG CCGAACTGCA GAAGGCTGAA 
GCCGCCCAGG AGACGCGAAT GAGCATTCTC AGGTCCAGGC TCAAGGACAT CTACCAGGTG 
GGGCGGGTAA ACTACCTGGA GGTGCTCTTG CAGTCCACCA GCCTGGAGGA TTTCCTGGTG 
CGCCTGGAAC TCCTGACCAA GATAGCCCGG GGCGACATCA ACCTGATCGA CGAGATCAAG 
GCGGAAAAGG CGAAGATCGC CGCCCAGAAG GCCGAGCTGG AGGCCGAGCG GGATCACATC 
GCCCAGCTCC GGCGCCAGGC AGACAACGAG AGGGTGCAGC TCGCTTCCCG GCAGGAGAAC 
CAGCGCCAGC TCCTGGCCCA GGTGGAGCAG GAGAAAAAAC GGGTGGCCGC GGCCCTGGAC 
GAGATGGAAG CCACGGCCCG GCAGATAGCC GCCAAGATCC GGGCCGAGCA GGCTAAAAGC 
AACCGCAAGC TTTCGCCCAG TGGGACGAAG GGCATGCTCT GGCCGCTGCC GGGGTACACC 
CAGATCTCCT CACCCTTCGG GTGGCGCATC CATCCCCTTC TGAAAACCAA CCGCTTCCAC 
GACGGCGTCG ACCTGCCGGC ACCTGCGGGA ACAGAGATAA TTGCTCCTCT GGATGGGCAG 
GTTATTTCCA CCGGCTATCT GGGGGGATAC GGCAACCATA TCGTCATCGA CCACGGCGGC 
GGGCTTTCCA CCATGTACGC TCACCTGTCG GCCATCCTGG TCCAGAATGG CCAGGAGGTT 
AAAAAGGGCC AGGTGATCGG CCGCGTGGGA TCTACGGGTT GGAGTACGGG CCCGCACCTG 
CACTTCATGG TCCTGCTTCA GGGCGAGCCA ACTAATCCCA TGAATTATTA CTAA

Protein sequence

MRRKATALLL MAALALGTVP AHGASVDDLQ RQQQQLQQNI QEQQKLLQQK NDEGEALLQQ 
LQQIEEDIRQ KQAQIASLDQ QLAAAQGRVQ QVAAELQKAE AAQETRMSIL RSRLKDIYQV 
GRVNYLEVLL QSTSLEDFLV RLELLTKIAR GDINLIDEIK AEKAKIAAQK AELEAERDHI 
AQLRRQADNE RVQLASRQEN QRQLLAQVEQ EKKRVAAALD EMEATARQIA AKIRAEQAKS 
NRKLSPSGTK GMLWPLPGYT QISSPFGWRI HPLLKTNRFH DGVDLPAPAG TEIIAPLDGQ 
VISTGYLGGY GNHIVIDHGG GLSTMYAHLS AILVQNGQEV KKGQVIGRVG STGWSTGPHL 
HFMVLLQGEP TNPMNYY