Gene Moth_0843 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0843
Symbol	murG
ID	3831540
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	875996
End bp	877111
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	61%
IMG OID	637828773
Product	undecaprenyldiphospho-muramoylpentapeptide beta-N- acetylglucosaminyltransferase
Protein accession	YP_429703
Protein GI	83589694
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0707] UDP-N-acetylglucosamine:LPS N-acetylglucosamine transferase
TIGRFAM ID	[TIGR01133] undecaprenyldiphospho-muramoylpentapeptide beta-N-acetylglucosaminyltransferase

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCGGGTGA TAATTACCGG CGGCGGTACC GGGGGCCATG TTTACCCGGC CCTGGCCATT 
GCTCGCGGCC TTAAAGAGGC CAGGCCGGGG GTAGAGTTAC TGTATATCGG GACGGCCAGG 
GGTCTGGAAG CTGACGTGGT ACCCCGGGCT GGCCTGACCC TGGCCACCAT TACCGTCCAG 
GGGCTGGTGC GACGGCAAGT ATGGAAGAAC ATTCCCGCCC TGGTGAAGAC CGGCCGGGGG 
CTTGGCGAGG CCTGGCAGCA GGTGCGCCGT TTTCGACCAG ACGTAGTAGT CGGCACCGGT 
GGCTATGTCA GCGGCCCGGT GTGCCTGGCT GCCGCCCTCC AGGGCGTACC GGTAATCCTC 
CATGAACAGA ATGCCTTTCC GGGTGTTACC AATCGGCTGC TGGCGATCCT GGCTCGCTGC 
GTCTGCCTGA CCTTTCCCGA GGCAGCCTCC CGTTTCCCTC GCCGGGCAAA ACTGGTTACC 
ACCGGGCTAC CGGTACGGCC GGAGATAATC CAGGCGGACC GGGATTCATG CCGGCAGCAT 
TTCGGCCTGC GGCCGGAGCA ACTCTTCCTG GTAACTGTTG GTGGCAGCCA GGGGGCCAGG 
AGTATTAACG GGGCCATGTT ACCTATTTTG AAGGAACTGG CCGGGTGCCA GGATGTCAGC 
CTTCTCCAGG TAACAGGACG CCGGGACTAT GAGGCTTATT TACAGCAGGT GCGCACCCAG 
GGAATAGATC TGGCTAAATA TGGCAACATT ACCATTGAAC CCTATGTCTA TAACCTGGAG 
CAGGCCCTGG CTGCAGCCGA CCTGGTCATC GGCCGGGCCG GGGCCTCCTT TTTAGCCGAA 
GTACTGGCCC GGGGTCTGCC GTCCGTCCTG GTTCCCTATC CCCATGCGGC AGCCAATCAT 
CAGGAGTATA ATGCCCGGGC CGTGGCCCGG CAGGGGGCGG CCGTGGTGGT CCTGGACCGG 
GAACTAAAAG GAGGGCGGCT TTACCAGGTT GTATTCGAAC TCCTGAGATC AAGGGAAAAG 
CTAAAGGCCA TGGCGGCTGC CGCCGCTTCA TTAGGTCGTC CCGGAGCCCT GGAGGCTATT 
ATCCAGGTTA TCTTGAAAAC GGTCGAATCA GGTTAG

Protein sequence

MRVIITGGGT GGHVYPALAI ARGLKEARPG VELLYIGTAR GLEADVVPRA GLTLATITVQ 
GLVRRQVWKN IPALVKTGRG LGEAWQQVRR FRPDVVVGTG GYVSGPVCLA AALQGVPVIL 
HEQNAFPGVT NRLLAILARC VCLTFPEAAS RFPRRAKLVT TGLPVRPEII QADRDSCRQH 
FGLRPEQLFL VTVGGSQGAR SINGAMLPIL KELAGCQDVS LLQVTGRRDY EAYLQQVRTQ 
GIDLAKYGNI TIEPYVYNLE QALAAADLVI GRAGASFLAE VLARGLPSVL VPYPHAAANH 
QEYNARAVAR QGAAVVVLDR ELKGGRLYQV VFELLRSREK LKAMAAAAAS LGRPGALEAI 
IQVILKTVES G