Gene Moth_0517 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0517
Symbol
ID	3831819
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	536384
End bp	538357
Gene Length	1974 bp
Protein Length	657 aa
Translation table	11
GC content	59%
IMG OID	637828451
Product	N-acetylmuramoyl-L-alanine amidase
Protein accession	YP_429390
Protein GI	83589381
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0860] N-acetylmuramoyl-L-alanine amidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000337238
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTAGAC GCCTGACAAA TGGCCGGTGG GGCCTGACGC TGCTGATACT GGCGTTGATG 
TACATAATTG CGCTGGGGCT GATGGCCCGG CCGGCTGCAG CTGACCCCGG GATTACTCTA 
GTCTTGAACG GCAGCAGGGT TAACCCCTCG GTTCCAGCCT ACACCGACAG CAACGGTCGT 
ACCATGGTAC CTGTGCGTTT TGTCATGGAA CACATGGGGG GCAGGGTGGA GTGGCTGGAT 
GCCGAGCAGG GGATAGTAGT CAGCCGGGGA GCGACAACTT TAAAAATGTG GATTGGCAAA 
CGCCAGGCCC AGGTCAACGG CCAGGCTATT GACCTGGATA CAGTACCTGT CCTCCAGGAT 
GGCACCAGCA TGGTACCGGT GCGTTTTGTC GCCCAGGCTT TCGGCGGGAA GGTTGAATGG 
GATGATGCCT CCCGGACAGT TAGCATCTGG CTGGGTACGG CGTCGCCCGC CGGCCAGGTG 
CGGATAACCG GCAGTTATGT CAATGTCCGG ACCGGGCCGG GGACTTCCTA TGGGGTAATT 
GATGTCCTGC CCAGGGACAC GCTGGTGCAA TTGTTGGCTA CAGGCGATGG ATGGTACCAG 
GTGCAGTTGC CGGATGGACG CCAGGGTTGG GTTTCGGCCA GTTATTCCGA AGTGCTCCAG 
GGCAACAACC AACCCCAGGA TACCAATCCT CCCGGCAATA ATCAGCCCGG GAACGGGCAG 
TCGCCAGGCA ACAACCCGTC ACCTGGCAAT AATCAGCCGG GGAATGAAGA ACCACCGTCC 
GGACAACCCT TGGGCACAGC GATAATCGGT AACAAGCCGG TGGCCATTTT AGCCGGACCT 
AACCCGGTGG AAAAACAAGT CGGTATGGCA CCGGCCGGCA GCCGGTTACC CATCTGGCAA 
CAGCAGGGTG ACTGGTGGTT GGTGGAGCTG GATAATGGCC TGCGGGGCTG GCTGGCCAGT 
TCCCTGGCAA CCTTTTCACC CGAAAAACCG GGCCAGGATA ATGGCGGGTC CGAAACGGGT 
AACGGTGGGA CGGCACCTGG TGAAGGTAAT CAGGGAGTGG GCAACAGTGA TAGCAACAGC 
CTCAAGATAA CCGGCGTCAC GGTAAATCCC GGGCCCGATT GGATTGAAGT AACGGTACAG 
GGTACCCGGC CCTTTACCTT TAAAAGCTCC CGTTGGGCCG ACCACCTGAT TTTCGATATA 
CCAGGAGCCA CCCTGGCGGT AGCACCGGGG CAGGACAAGG TGGAAGTGAA CCGGCAGCCG 
CTGGCCCGGG TGCGCCTGGG ACAGTATGAT GCCAACACCG TGCGAGTGGT ATGCGATCTT 
AATGGGGCAG CCAATTTTAC CACAACGACA GCCGGATCTA CTATAACCAT CAGGCTGCAA 
AAACCCTCTG TCCGGGGGGC TAAAATTGTC ATTGATCCCG GCCATGGTAC CGACCCGCAA 
GGTTCTGACC CCGGGGCTAT CGGTCCCAGC GGCGTTCAGG AGAAGGACGT CAACCTGGCC 
ATCTCCCGGA AATTGGCGGA ACTCTTGCGC GCCGCCGGGG CGACGGTTTA TATGACCCGT 
GATGGGGAAA CAACTCCGTA TACCCTATCC GGTAGGGCCT ATTACGCCAA CGAAGTCGGC 
GCCGACCTTT TCATCTGCAT TCACTCCAAC GCGTCCCTGA GCCCTTCAGC CTCGGGTACA 
TCAACCTATT TCTATGCGCC GCCGGGGACG GCCCTGGGAG AACAGCGGGA TGCACGCCAG 
CGCCTGGCCA CCCTTATCCA GAGGGATCTG GTAGCTGCTA TCGGCCGGCG CGACCTGGGG 
GTTAAAGAGG CCAATTTCGC AGTCCTGCGC AATACCAAAA TGCCCTCGGT GCTTGTAGAG 
ACGGCCTTTA TCTCGAATCC TACGGAGGAG CAGCTCCTGG CCAGTCCTGA TTTCCAGGCC 
CTGGTGGCCC AGGGGATCTT TAACGGCATC AGTGACTACC TCTCCGGCCA GTAG

Protein sequence

MVRRLTNGRW GLTLLILALM YIIALGLMAR PAAADPGITL VLNGSRVNPS VPAYTDSNGR 
TMVPVRFVME HMGGRVEWLD AEQGIVVSRG ATTLKMWIGK RQAQVNGQAI DLDTVPVLQD 
GTSMVPVRFV AQAFGGKVEW DDASRTVSIW LGTASPAGQV RITGSYVNVR TGPGTSYGVI 
DVLPRDTLVQ LLATGDGWYQ VQLPDGRQGW VSASYSEVLQ GNNQPQDTNP PGNNQPGNGQ 
SPGNNPSPGN NQPGNEEPPS GQPLGTAIIG NKPVAILAGP NPVEKQVGMA PAGSRLPIWQ 
QQGDWWLVEL DNGLRGWLAS SLATFSPEKP GQDNGGSETG NGGTAPGEGN QGVGNSDSNS 
LKITGVTVNP GPDWIEVTVQ GTRPFTFKSS RWADHLIFDI PGATLAVAPG QDKVEVNRQP 
LARVRLGQYD ANTVRVVCDL NGAANFTTTT AGSTITIRLQ KPSVRGAKIV IDPGHGTDPQ 
GSDPGAIGPS GVQEKDVNLA ISRKLAELLR AAGATVYMTR DGETTPYTLS GRAYYANEVG 
ADLFICIHSN ASLSPSASGT STYFYAPPGT ALGEQRDARQ RLATLIQRDL VAAIGRRDLG 
VKEANFAVLR NTKMPSVLVE TAFISNPTEE QLLASPDFQA LVAQGIFNGI SDYLSGQ