Gene Smed_2084 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2084
Symbol	murD
ID	5322943
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	2141181
End bp	2142572
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	64%
IMG OID	640791021
Product	UDP-N-acetylmuramoyl-L-alanyl-D-glutamate synthetase
Protein accession	YP_001327752
Protein GI	150397285
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0771] UDP-N-acetylmuramoylalanine-D-glutamate ligase
TIGRFAM ID	[TIGR01087] UDP-N-acetylmuramoylalanine--D-glutamate ligase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0517095
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.000454332
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGATCCCGG TCACTTCATT CAAGGGTAGG AAGGTCGCAC TCTTCGGGCT GGGCGGCTCC 
GGACTGGCGA CCGCCCAGGC GCTCGTTGCA GGCGGAGCCG ATGTGGTGGC TTGGGACGAC 
AACCCCGACA GCGTCGCCAA GGCGGATCAG GCCGGGATCG CGACGGCCGA TCTGCGGGGC 
GAGGAATGGC ATGCCTTTTC CGCCTTGGTC CTTTCGCCCG GCGTGCCGCT GACCCATCCA 
AAGCCGCATT GGAGCGCCGA CCTCGCGCAT CATGCCGGCG TCGAGATCAT CGGCGATGTC 
GAGCTGTTCG TGCGCGAGCG GCGCAAGCAC GCGCCTGACT GCCCTTTCAT TGCCATCACC 
GGCACCAACG GCAAATCCAC GACGACGGCG CTGATCGCCC ATATCCTGCG CGCAAGTGGG 
CGGGACACAC AGCTCGGCGG CAATATAGGC ACAGCGGTGC TGACGCTGGA GCCGCCGCAG 
GCGGACCGCT TCTATGTCGT CGAATGCTCA TCCTACCAGA TCGACCTGGC ACCCACGCTC 
GATCCCACCG CCGGGATACT CCTCAACCTC ACGCCGGATC ATCTGGATCG CCATGGTACG 
ATGCAGCACT ATGCCGACAT CAAGGAGCGC CTGGTGGCGG GGAGCGGAAC GGCGATTGTC 
GGTGTCGACG ACAGCCTTTC GAGTCTGATT GCCGACCGGG TGGAGCGAGC AGGTACCAAG 
GTCGTGCGTA TCTCGCGCCG TCATCCGCTT GCCGAAGGTG TCTATGCCGA AGGTACGGCG 
CTGATGCGTG CGACTGGCGG GGCATCGTCG CTCTTTACCG ACCTTGCCGG GATCCAGACG 
CTGCGTGGCG GTCACAATGC CCAGAATGCC GCGGCCGCGA TCGCCGCGTG CCTGGCGGTC 
GGCATTTCCG AAAAGGACAT AGTGGACGGC CTCAGAAGCT TTCCGGGGCT CAAGCACCGG 
ATGCAGCCGG TTGCGAAGAA GGGCGAGACC ATCTTCGTCA ACGATAGCAA GGCGACCAAC 
GCCGAGGCCG CAGCACCGGC GCTGTCGAGT TACGACCGTA TCTACTGGAT CGCCGGCGGT 
CTGCCGAAGG AGGGCGGCAT CACCTCGTTG ACGCCATTCT TTCCGAAAAT CGTCAAAGCC 
TATCTGATCG GAGAGGCGGC GCCGTCTTTC GCGGCGACCC TCGGCGAGGC AGTGCCCTAC 
GAAATCTCGG GGACATTGGA AAAAGCGGTT GCGCATGCGG CATCGGACGC GGCGCGCGAT 
GCCGGGGCGC CGGCGACCGT GATGCTTTCC CCGGCTTGCG CAAGCTTCGA CCAGTATAAG 
AACTTCGAAC TGCGCGGAGA TGCCTTCGTC GAGCACGTGA AGGCGCTCGA GGGCGTGATC 
ATGCTCATCT GA

Protein sequence

MIPVTSFKGR KVALFGLGGS GLATAQALVA GGADVVAWDD NPDSVAKADQ AGIATADLRG 
EEWHAFSALV LSPGVPLTHP KPHWSADLAH HAGVEIIGDV ELFVRERRKH APDCPFIAIT 
GTNGKSTTTA LIAHILRASG RDTQLGGNIG TAVLTLEPPQ ADRFYVVECS SYQIDLAPTL 
DPTAGILLNL TPDHLDRHGT MQHYADIKER LVAGSGTAIV GVDDSLSSLI ADRVERAGTK 
VVRISRRHPL AEGVYAEGTA LMRATGGASS LFTDLAGIQT LRGGHNAQNA AAAIAACLAV 
GISEKDIVDG LRSFPGLKHR MQPVAKKGET IFVNDSKATN AEAAAPALSS YDRIYWIAGG 
LPKEGGITSL TPFFPKIVKA YLIGEAAPSF AATLGEAVPY EISGTLEKAV AHAASDAARD 
AGAPATVMLS PACASFDQYK NFELRGDAFV EHVKALEGVI MLI