Gene Hmuk_0120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_0120
Symbol
ID	8409617
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	+
Start bp	120533
End bp	121666
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	71%
IMG OID	645018445
Product	Mandelate racemase/muconate lactonizing protein
Protein accession	YP_003175965
Protein GI	257386192
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.102708
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.754762
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCGGA TCGTCGACTA CGAACTGTTC GAGGTGCCGC CGCGCTGGCT GTTCCTGAAG 
CTCGAAACGG CCGACGGAAC CACGGGCTGG GGCGAACCCA TCCTCGAAGG GCGTGCCGCG 
ACCGTCCGCA CCGCCGTCGA GGAGCTACTG GAGGGGTACC TGCTGGGCGA GGCGGCGGGC 
CGGATCGAGG ATCACTGGCA GACGATGTAT CGCGGCGGCT TCTACCGCGG TGGCCCCGTG 
CTCATGTCGG CGATCGCCGG GATCGACCAG GCGCTGTGGG ACATCGAGGG CAAGCGGACG 
GATCGGTCGG TCGCCGACCT GCTGGGCGGT TCCACGCGCG AGCACGTCCC GGTCTACAAG 
AAGCTCGTCC CGGAGCGCGT CGACAGGATC CCCGAACTGG CGACCGACGC CGTCGAGGCG 
GGCTACGAGA CGCTCAAGCT ACTGACGACC TACCAGACCG CCCCGCTGGA GTCGGGGGCC 
GACGTCGACG CGATCTGTGA GCACCTGTCG CTCGCTCGCG ACGCGGTCGG TCGGGCGGTC 
GACATCGGGG TCGACCTCCA CGGTCACGTC TCGGCGAGCA TGGCCCCGCG GGTGTGCGCC 
CGGCTCGCGG CGGACGACCC CGCGTTCGTC GAGGAGCCCG TCCGGCCCGA GCACCTGCGG 
ACGCTGGATC GGTCGGCCAC CCACGACGTT CCGGTGGCGT TCGGCGAACG GCTCTACTCG 
CGCTGGGAGT TCCGTCCGCA CCTCGAAGCG GGGCGGGTCG ACATCGTCCA GCCCGACGTC 
AGTCACGCGG GCGGGATCAC CGAGATCGCG AAGATCGCGT CGATGGCCGA GACCTACGGG 
GCGCGGGTGA TGCCGAGTTG CTCGGTCGGG CCGATCGCCC ACGCGGCCAG CACGCAGCTC 
AGCCACCACC TCCCGAACGC CGTCACGCAG CCCGACCTGG GCGAGCACTA CGTCGACGCC 
TACGTCGACA ACGCCGACGA ACTGCGCAGC GAGAACGGGC GGGTAACCCT TCCTGATCGG 
CCCGGCCTCG GCGTCGACGT GAACGAGGCG GGCGTCCGGG ACCACGCCGG CACGGGAAGC 
GACTGGCGAC CGCCGGTCCG ACGGTACGAC GACGGGAGTT TCGTCGAGTG GTGA

Protein sequence

MTRIVDYELF EVPPRWLFLK LETADGTTGW GEPILEGRAA TVRTAVEELL EGYLLGEAAG 
RIEDHWQTMY RGGFYRGGPV LMSAIAGIDQ ALWDIEGKRT DRSVADLLGG STREHVPVYK 
KLVPERVDRI PELATDAVEA GYETLKLLTT YQTAPLESGA DVDAICEHLS LARDAVGRAV 
DIGVDLHGHV SASMAPRVCA RLAADDPAFV EEPVRPEHLR TLDRSATHDV PVAFGERLYS 
RWEFRPHLEA GRVDIVQPDV SHAGGITEIA KIASMAETYG ARVMPSCSVG PIAHAASTQL 
SHHLPNAVTQ PDLGEHYVDA YVDNADELRS ENGRVTLPDR PGLGVDVNEA GVRDHAGTGS 
DWRPPVRRYD DGSFVEW