Gene Moth_0838 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0838
Symbol
ID	3831535
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	869632
End bp	871131
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	63%
IMG OID	637828768
Product	UDP-N-acetylmuramoylalanyl-D-glutamate--2, 6-diaminopimelate ligase
Protein accession	YP_429698
Protein GI	83589689
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0769] UDP-N-acetylmuramyl tripeptide synthase
TIGRFAM ID	[TIGR01085] UDP-N-acetylmuramyl-tripeptide synthetase

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.595985
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCCTGG CTGAACTGGT AGCGCCGTTA AAGATCATTG CCCGGGGCGG CAACCAGCAG 
GTTCCCCTGA CCGGGCTCCA CTATGACTCC CGCCGGATAC AATCCGGTTT TCTTTTCGTG 
GCCATAAAAG GCTTTAAAAC CGACGGCCAC CTTTACATCG ACGCCGCCCT GGAGCGGGGA 
GCGGTGGCTG TCGTCCTGGC ACAGGAGCGA ACCCTGCCCC CGGGGGTGGC CTGGGTTCGG 
GTGGATGATA CCCGCCTGGC CCTGGGCCAG CTGGCGGCCC GTTTCTATGA TTACCCCAGT 
CGCAAACTGC GTTTAATCGG GGTAACCGGC ACCAACGGCA AGACCACCAC TACCCACCTG 
ATCCAGGCTA TTTTAGAGGC CGGCGGCCGG CCTGCTGGCC TGGTAGGGAC CATCGGCAAC 
CGCCTGGGGG ACAGGGTACT GCCGGCCGAA CACACGACGC CGGAATCCCT GGACCTGCAG 
CACCTCCTTT ACCAGATGGT GTCTTTGCAG GCCCGGGCCG TAGTCATGGA GGTATCATCC 
CACGCCCTGG CCCTGCATCG GGTGGCCGGG ACCGAGTTTG ACGTGGCCGT TTTCACTAAC 
CTGACTCAGG ATCACCTGGA CTTCCACCAC AATATGGAGG ATTATTTCAA CTGCAAAGCC 
CGGCTCTTCC AGGGCCTGGA CCAGGGGGTG AAAGCTGGGC CGAAATATGC CGTTATTAAC 
GGCGACGACC CCTATGGCAG CCGCCTGGCC GCCCTTACGC CGGTGCCGGT GGTCACCTAC 
GGCTGTACTC CCGGGTGCCA GGTCCGGGCC AGGGATATCC ATTTAGAAAC CGGGGGCTCC 
ACCAGCCTGG TAACCTGGCC GGGGGGTGAG GCGGCAATGG AACTCAGGCT TACCGGGCGA 
TACAATATCT ATAATGCCCT GGCCGCCTTG GCGGTAGCCC TTCAGGAAGG GATAGACCCC 
CAGGTCGCCA TCCGGGCTCT GGGCCGGTTC AAGGGGGTGC CAGGGCGTCT GGAGCGGGTA 
GACCAGGGCC AGCCCTTCAC TGTGGTGGTC GATTACGCCC ATACTCCCGA TGGCCTGGAG 
AATGTCCTCC GGGCCGCTCG CCAGGTTACC AGGGGAAGGC TGCTGGTGGT CTTCGGCTGC 
GGTGGTGACC GGGACCGGGG CAAGCGACCG TTAATGGGCC GGGCCGCCGC TCGGCTGAGC 
GATTACAGTA TTATTACGTC CGATAACCCT CGCAGCGAGG ATCCGGAAGC CATTATCGCC 
GATATCCTTC CCGGCGTCCG GGAGGTCCCC GGCGCCAGCT ACCAGGTGCT GGTTGACCGG 
CGCCGGGCTA TAGCTGCCGC CCTGGCCCTG GCCCGGCCTG GGGACATGGT GGTTATCGCC 
GGTAAAGGCC ATGAAACCTA CCAGATAGTT AAGGATAAAA CCCTGCCCTT TGATGACCGG 
CAAGTAGCCA GGGAAGAACT GGCGGCCCTG GGCTACACGG GGGAGGGACC GGCATGTTGA

Protein sequence

MTLAELVAPL KIIARGGNQQ VPLTGLHYDS RRIQSGFLFV AIKGFKTDGH LYIDAALERG 
AVAVVLAQER TLPPGVAWVR VDDTRLALGQ LAARFYDYPS RKLRLIGVTG TNGKTTTTHL 
IQAILEAGGR PAGLVGTIGN RLGDRVLPAE HTTPESLDLQ HLLYQMVSLQ ARAVVMEVSS 
HALALHRVAG TEFDVAVFTN LTQDHLDFHH NMEDYFNCKA RLFQGLDQGV KAGPKYAVIN 
GDDPYGSRLA ALTPVPVVTY GCTPGCQVRA RDIHLETGGS TSLVTWPGGE AAMELRLTGR 
YNIYNALAAL AVALQEGIDP QVAIRALGRF KGVPGRLERV DQGQPFTVVV DYAHTPDGLE 
NVLRAARQVT RGRLLVVFGC GGDRDRGKRP LMGRAAARLS DYSIITSDNP RSEDPEAIIA 
DILPGVREVP GASYQVLVDR RRAIAAALAL ARPGDMVVIA GKGHETYQIV KDKTLPFDDR 
QVAREELAAL GYTGEGPAC