Gene TM1040_2018 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2018
Symbol	murE
ID	4077475
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	2121197
End bp	2122681
Gene Length	1485 bp
Protein Length	494 aa
Translation table	11
GC content	66%
IMG OID	638007333
Product	UDP-N-acetylmuramoylalanyl-D-glutamate--2, 6-diaminopimelate ligase
Protein accession	YP_614012
Protein GI	99081858
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0769] UDP-N-acetylmuramyl tripeptide synthase
TIGRFAM ID	[TIGR01085] UDP-N-acetylmuramyl-tripeptide synthetase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.821949
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACAGA GACCAGCGCT CAAGCTCAGC CAGTTGGGAC TGACCGCAAG AGCGGGCCTG 
GACCCGCAGA TCACGGGGCT TGCGGTGGAC AGCCGCGAGG TTGGCGAGGG TTTTGTTTTT 
GCCGCCCTGC CCGGCACGCG CGTGCATGGT GCAACCTTTG TCGAACAGGT GCTCGATCAG 
GGCGCGGTGG CCATTCTGAC CGACGCCAAG GGCGCCGAGA TCGCAGGCGA GGCCATTGCC 
GCAGCGGGCG CAGCCCTTGT GGTGGCCGAA GACCCGCGGC AGGCGCTCTC GGGTGCAGCG 
GCGCTCTGGT TTGGCGCCCA GCCCCCGGTG ATGGCAGCCG TGACAGGCAC CAATGGCAAG 
ACCTCCGTGT CGACCTTCCT GCGCATGATC TGGACCGAGC TTGGCCACAA GGCCGTGAAC 
CTTGGCACCA CCGGCATCGA GGGCGCATGG TCACATCCGC TGGCGCATAC CACGCCCGAG 
CCGATCACCC TGCACCGCGC GCTTGCGGCA GCAGCCGAGG CGGGCGTCAC CCATGCGGCG 
ATGGAGGCCT CCTCGCATGG GCTGGATCAG CGGCGGCTGG ACGGTGTACA GCTCTCGGCG 
GCGGGTTTCA CGAATTTCAC CCAGGATCAC CTCGACTATC ACGAGACCTT TGAGGCCTAT 
TTTGCGGCCA AGGCAGGGCT TTTCCGTCGT GTGCTCTCGG AAGATGGCGT CGCCGTCATC 
AATATGACCG ACCCCAAAGG GGCTGAGATG CGCGCCATTG CTGCCGCCCG CGGGCAGGAG 
ATCATTACGG TTGGGCGCGG TCTGGGTGAC ATTGCCCTGA TGGGTATGCG AGTCGATGCC 
ACCGGGCAGG ACATCCGGTT CACATGGCAC GACCGCCCCT TTGCCAAGCG GTTGAACCTC 
ATCGGCGGCT TTCAGGCGGA AAACGTGCTG GTGGCGGCGG GTCTGGCGAT TGCCAGCGGC 
GAGGACCCCG AGCAGGTGTT TGACACCCTG CCTCACCTCA GCACGGTGCG CGGGCGGATG 
CAGCTTGCGG CAACCCGCGA CAATGGCGCG ACGGTGTTTG TGGATTACGC CCACACCCCC 
GACGCGGTTG CCACCGCGAT CAAGGCGCTG CGCCCGCATG TTCTGGGCCG CCTTGTGGCG 
ATCGTCGGCG CGGGCGGGGA TCGCGATGCA ACCAAACGCC CCTTGATGGG CGCCGCAGCG 
CAGGACAATG CCGATGCGGT GATCGTCACC GATGACAACC CCCGCTCTGA AGATCCCGCC 
GCCATTCGCG CGGCCGTCAT GGGCGGCGCG CCGGACGCGC TCAATGTGGG CGACCGCGCC 
GAAGCGATCC TGCGCGGCGT CGATATGCTC GAGGCTGGCG ATGCGCTCCT CATCTGCGGC 
AAGGGCCATG AGAGCGGCCA GACCATCGGC ACCGATGTAT TGCCCTTTGA CGACGTGGAG 
CAGGCCAGCA TGGCCGTCGC CGCCCTTGAC GGGAGAATGG TATGA

Protein sequence

MTQRPALKLS QLGLTARAGL DPQITGLAVD SREVGEGFVF AALPGTRVHG ATFVEQVLDQ 
GAVAILTDAK GAEIAGEAIA AAGAALVVAE DPRQALSGAA ALWFGAQPPV MAAVTGTNGK 
TSVSTFLRMI WTELGHKAVN LGTTGIEGAW SHPLAHTTPE PITLHRALAA AAEAGVTHAA 
MEASSHGLDQ RRLDGVQLSA AGFTNFTQDH LDYHETFEAY FAAKAGLFRR VLSEDGVAVI 
NMTDPKGAEM RAIAAARGQE IITVGRGLGD IALMGMRVDA TGQDIRFTWH DRPFAKRLNL 
IGGFQAENVL VAAGLAIASG EDPEQVFDTL PHLSTVRGRM QLAATRDNGA TVFVDYAHTP 
DAVATAIKAL RPHVLGRLVA IVGAGGDRDA TKRPLMGAAA QDNADAVIVT DDNPRSEDPA 
AIRAAVMGGA PDALNVGDRA EAILRGVDML EAGDALLICG KGHESGQTIG TDVLPFDDVE 
QASMAVAALD GRMV