Gene Mlg_0604 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0604
Symbol
ID	4268483
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	656075
End bp	657436
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	71%
IMG OID	638125351
Product	UDP-N-acetylmuramate
Protein accession	YP_741448
Protein GI	114319765
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0773] UDP-N-acetylmuramate-alanine ligase
TIGRFAM ID	[TIGR01081] UDP-N-acetylmuramate:L-alanyl-gamma-D-glutamyl-meso-diaminopimelate ligase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.197078
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.000000000266395
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCATCTAC ACATCCTGGG CATCTGCGGC ACCTTCATGG GGGGCCTGGC CCTGCTGGCG 
CGGGAGGCCG GTCACGTGGT GAGCGGTAGC GACCAGGGCA TCTACCCGCC CATGAGCGAC 
ATGCTGGCGG AACAGGCCGT GGACCTGCGG GCCGGTTATG CCCCCTCACA CCTGCAACCG 
CCCCCCGATC AGGTGATTGT CGGCAACGCC CTGTCGCGCG GTAATCCGGC GGTGGAGTAC 
GTGCTGGACC AGGGCCTGCG CTACACCTCG GGGCCCCAGT GGCTGGGCGA GCACCTCCTC 
CACGACCGCT GGGTCCTGGC GGTCTCCGGC ACCCACGGCA AGACCACCAC CGCCAGCCTG 
TTGGCCTGGA TCCTGGAGTA CGCCGGATTG AACCCGGGCT TCCTGGTGGG CGGGGTGCCG 
ACCAACTTCG GCCGCTCGGC CCGCCTCGGC GACGGGCCGT TTTTCGTCAT CGAGGCGGAT 
GAATACGACA GCGCCTTTTT CGACAAGCGC TCCAAATTCA TCCACTTCCG CCCCCGCACC 
CTGGTGATCC ACAACATCGA GTACGACCAT GCGGACATCT TCCCCGACCT GGCCGCCATC 
CAGCGCCAGT TCCACCACCT GGTGCGCACC GTGCCGGGCA ACGGCCTGAT CATCGCCAAC 
GGCGATCAGG CCAATGTTGC CGAGACCCTG GGCCAGGGCT GCTGGACCCC CACCCTGCGC 
CTGGGCACCG GGCCCGACTG CGACTGGCGC TACGACCTCA ACGGGCAGGG CGAAATGGTG 
CTGCGCGGCG GGGATGCCAC CCCGCTGACC GCCCGACCAC CGCTGCCCGG CCTGCACAAC 
GCGGCCAACT GCGCCGCCGC ATTGCTCGCA GCCCGCCACG TCGGGGTCCC ACTGAGCACC 
GGGCTCGACG CACTGGCCGG CTTCCGCGGC GTGAAGCGGC GCCTGGAGCT GCGGGGTGAG 
GCCGGCGGCG TGCGGGTGTA CGACGATTTC GCCCACCACC CCACCGCCAT CCGCGCCACC 
CTGGAGGCCA TGCGGCCCGG CCCGGGGCGA TTGCTGGCAG TGCTGGAGCC CCGCTCCAAC 
ACCATGCGCA TGGGCATCCA CCGGGAACGG CTGGCCGCCG CCCTCGCCCC CGCCGACGCC 
GTCTTCGCCC TGCAGGGCAA GGGCCTGGAG TGGTCGGTGG CGGACGCCCT GGCCGGGCTC 
ACCCCGCCCG CCGAGGTGGC GCAGGACGTG CCGGCGCTGG TCCAGCGCAT CCGGCAACAG 
GCCCGCCCGG GGGACCGGGT GGTGGTGATG AGCAACGGCG CCTTCGACGG TCTGCACGGC 
CGCCTGCTGG CGGCCCTGGA TGGCCGGGAG GTCTCGGCAT GA

Protein sequence

MHLHILGICG TFMGGLALLA REAGHVVSGS DQGIYPPMSD MLAEQAVDLR AGYAPSHLQP 
PPDQVIVGNA LSRGNPAVEY VLDQGLRYTS GPQWLGEHLL HDRWVLAVSG THGKTTTASL 
LAWILEYAGL NPGFLVGGVP TNFGRSARLG DGPFFVIEAD EYDSAFFDKR SKFIHFRPRT 
LVIHNIEYDH ADIFPDLAAI QRQFHHLVRT VPGNGLIIAN GDQANVAETL GQGCWTPTLR 
LGTGPDCDWR YDLNGQGEMV LRGGDATPLT ARPPLPGLHN AANCAAALLA ARHVGVPLST 
GLDALAGFRG VKRRLELRGE AGGVRVYDDF AHHPTAIRAT LEAMRPGPGR LLAVLEPRSN 
TMRMGIHRER LAAALAPADA VFALQGKGLE WSVADALAGL TPPAEVAQDV PALVQRIRQQ 
ARPGDRVVVM SNGAFDGLHG RLLAALDGRE VSA