Gene Smed_5102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5102
Symbol
ID	5319404
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	49375
End bp	50499
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	62%
IMG OID	640776880
Product	mandelate racemase/muconate lactonizing protein
Protein accession	YP_001313812
Protein GI	150377217
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.401813
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCAAAA TATCAGGCAT CCGCGTCCGT CCGCTGGTTC TGCCGCTGAA ACAGCCTTAT 
CACTGGTCCT ACGGCATTCG CGAATCCTTT GCGGTCAACC TTATCGAGAT CGAGGCGGAT 
GACGGCTCGG TCGGGATCGG CGAATGCACG GTGGCGCCCG ATCAGGCCGG TACGGCGGCC 
ATTCTTCATC GCCTTGCCGG ACATCTCATC GGCCATTCGC CCCATGATGT GGCGCCGCTC 
ATCGCGCGCA TCTTCCACCA GGAATATCTC GGGCACGGCG CCAATATCAT GCGTGCGGCC 
AATCAGGTGT TCTCCGGTAT CGACATGGCC ATGTGGGATC TGCAGGGCAA GCTCGCCGGC 
TTGCCCGTGC ACCAGCTGCT GGGCGGCGCA CACCGGAAGG CGGTCGGCTA TTTCTACTTC 
CTCCAGGGAG AAACCGCCGA AGAGCTTGCG CGGGATGCCG CCGCCGGTCG GGCCCGGGGC 
GAGCGGGTCT TCTATCTCAA GGTCGGCCGA GGCGAGAAGA CCGACCTGGA GATCACCGCT 
GCGGTTCGCC GCGAGATCGG CGACGCGCGC CTTCGCCTGG ACGCGAACGA AGGCTGGAGC 
GTGCATGACG CGATCAACAT GTGCCGCAAG CTGGAAAAAT ACGACATCGA GTTCATCGAG 
CAGCCGACGG TCAGCTGGAG TATTCCGGCC ATGGCGCATG TCCGCGAGAA GGTCGGTATT 
CCGATCGTCG CGGATCAGGC CGCCTTCACG CTCTACGACG TCTATGAGAT ATGCCGGCAG 
CGTGCTGCGG ACATGATCTG CATCGGCCCG CGCGAAATCG GCGGGATACA GCCGATGATG 
AAGGCGGCAG CCGTGGCGGA GGCCGCCGGG CTGAAGATCT GCATCCATTC CTCCTTCACG 
ACCGGCATCA CCACCTGCGC GGAGCACCAT ATCGGGCTTG CCATTCCCAA TCTCGATGAC 
GGTAACCAGA TCATGTGGCA GCTCGTTCAG AAGGATATCG TTTCCTCGCC GGATCTGGCG 
CCCAGGAACG GCTGGCTCGA TGCCTTCAAG AAGCCGGGAC TGGGCTTCCA ACTCGCCGAA 
GACCTGATCG CCGACGGCGA AAGACGCTTT GCGGCGAGCC GATGA

Protein sequence

MVKISGIRVR PLVLPLKQPY HWSYGIRESF AVNLIEIEAD DGSVGIGECT VAPDQAGTAA 
ILHRLAGHLI GHSPHDVAPL IARIFHQEYL GHGANIMRAA NQVFSGIDMA MWDLQGKLAG 
LPVHQLLGGA HRKAVGYFYF LQGETAEELA RDAAAGRARG ERVFYLKVGR GEKTDLEITA 
AVRREIGDAR LRLDANEGWS VHDAINMCRK LEKYDIEFIE QPTVSWSIPA MAHVREKVGI 
PIVADQAAFT LYDVYEICRQ RAADMICIGP REIGGIQPMM KAAAVAEAAG LKICIHSSFT 
TGITTCAEHH IGLAIPNLDD GNQIMWQLVQ KDIVSSPDLA PRNGWLDAFK KPGLGFQLAE 
DLIADGERRF AASR