Gene Moth_0844 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0844
Symbol
ID	3831541
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	877214
End bp	878620
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	59%
IMG OID	637828774
Product	UDP-N-acetylmuramate--L-alanine ligase
Protein accession	YP_429704
Protein GI	83589695
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0773] UDP-N-acetylmuramate-alanine ligase
TIGRFAM ID	[TIGR01082] UDP-N-acetylmuramate--alanine ligase

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.952175
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGATT TGGAAACAGG GGGTTGGACC CATTTTGTCG GCATCGGTGG TGTGGGTATG 
AGCGCCCTGG CACGCATCTT GTTGGCCCAG GGTTACCGGG TCTCAGGATC GGACCCGAAG 
GAGAACCAGT TTACCCGGAG CCTGGAGGCA GCCGGGGCCA TCATTTACCA CCAGCATGAT 
GCCGCCAATC TGGCCCCTGG AGTCCAGGAA GTAGTAATTT CTTCGGCAGT ACCGTCGTCC 
AATCCCGAAG TGGTGGCTGC CCGGCAGCGT TCGCTGCCGG TGGTTAAACG TGGGGAGCTG 
CTGGCCCGGC TCTTTAACGC CCGCCGGGGT ATTGCCGTAG CCGGCGCCCA CGGTAAAACG 
ACAACCTCGG CCCTGGTTGC CCTGGTAATG AAGGAAGGCG GTTTAGAACC GGCGGCGGTC 
ATCGGCGGTT ATGTCCGGGA GTTTGCCAGT AATGCCTACC CCGGCCGGGG GGATTTTCTG 
GTGGCGGAGG CTGATGAAAG CGACGGTTCT TTCCTCTGGT TAAAGCCGGA GATAGCCCTC 
ATAACCAATA TTGAAGCCGA CCATCTGGAA CATTACGGGA GCCTGGACCG GATTGTCGCT 
GCCTTTAAAG ACTTTATCGA TCAGATCCGG CCCGGCGGCA AGGCCATCCT GTGTGCTGAA 
GATCCCCGAG TTGCCGGGCT GGTTGCCTGT AGTCCCAGAC AGGTAATTAC TTACGGCCTC 
AATGGCAGGC CGGATTACAG GGCGACGGGG GTGCAAATGG CCGGAATGGG CGGGCGGGCC 
GCTATTTATT ACCGGGAACA GTATCTGGGG CAACTCACTA TGGCGGTACC CGGACGCCAC 
AATATCTTGA ATGCCCTGGG GGCCATTGCC GCAGGTCACC AGCTGGGGAT ACCCTTTGCC 
GTTATGGCCC GCGCCCTGGG TCAGTTCCGG GGAGTGGGGC GGCGTTTCGA AATCCTCTGG 
GATGACGGTA CTACCAGGGT GGTGGATGAC TATGCCCATC ACCCGACGGA AATCAGGGCG 
ACCCTGGCGG CCGCCAGCCA GGTGGGAGCG AAACGGGTGG TGGCTGTTTT TCAACCCCAT 
CGCTATACCA GGACCCACCA CCTGTACCGC GAGTTCGGGC AGGCCTTCAG GCAGGCTGAT 
GTAGTAATCG TTAATGATAT TTACCCGGCC GGCGAAGCCC CCCTGCCGGG GGTTAATTCC 
CAATTAATAA CCGGAGAAAT CAAAGGTAGT GGCCATCAGC AGGTGTACTA CCTGCCCACC 
CTGGAAGAAA CCCTGGCTTT TTTAAAGAAA TCCTGCCGTC CCGGGGATCT GGTTTTAACC 
CTGGGAGCGG GGGACGTCTG GCGGGTGGGG ATGGGCCTGG CGCAGTACCT GGAGGCCAAG 
CAAATTTTGC CCGGAGTAGG AGCGTAG

Protein sequence

MADLETGGWT HFVGIGGVGM SALARILLAQ GYRVSGSDPK ENQFTRSLEA AGAIIYHQHD 
AANLAPGVQE VVISSAVPSS NPEVVAARQR SLPVVKRGEL LARLFNARRG IAVAGAHGKT 
TTSALVALVM KEGGLEPAAV IGGYVREFAS NAYPGRGDFL VAEADESDGS FLWLKPEIAL 
ITNIEADHLE HYGSLDRIVA AFKDFIDQIR PGGKAILCAE DPRVAGLVAC SPRQVITYGL 
NGRPDYRATG VQMAGMGGRA AIYYREQYLG QLTMAVPGRH NILNALGAIA AGHQLGIPFA 
VMARALGQFR GVGRRFEILW DDGTTRVVDD YAHHPTEIRA TLAAASQVGA KRVVAVFQPH 
RYTRTHHLYR EFGQAFRQAD VVIVNDIYPA GEAPLPGVNS QLITGEIKGS GHQQVYYLPT 
LEETLAFLKK SCRPGDLVLT LGAGDVWRVG MGLAQYLEAK QILPGVGA