Gene Smed_5101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5101
Symbol
ID	5319403
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	48383
End bp	49378
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	65%
IMG OID	640776879
Product	malate/L-lactate dehydrogenase
Protein accession	YP_001313811
Protein GI	150377216
COG category	[C] Energy production and conversion
COG ID	[COG2055] Malate/L-lactate dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.186755
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.540647
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACGG TCGAGCTATC CCGGGAAGAG ATCGAAGCGG TTTGCCTTGC GGCGCTGACG 
GTCCATGGTG CCGCGGCCGG CAATGCGCGC CCGGTGGCGC GCGCGATCGC CATGGCAGAG 
GCGGCGGGCA ATCGCGTCTG CGGCCTTTAC TATCTCCCGA TCTTCTGCAG GCACCTGGCG 
ATCGGTAAGG TCGATGGAGG CGCCATTCCA GAGGTGTCGG CACGCGGCGT GACGGTGACG 
GTAGACGCAA GGTCCGGCTT TGCACATCCC GCCATAGCCG CAGGCACGCC AGCTCTGATC 
GATTTGGCAC GAAGCAACGG CCTCGGGGCA ATGGCGGTGC GCAACTCCTA TAATTGCCTC 
GCCCTCGGTC ATCACGTTCA CCCGCTCGCC GATGCGGGTC TGATAGGCAT CTGCGTCTCG 
AACGCACCTG CCGCCGTCGC GCCTCCCGGT GCGGCGGCGG CGCTCTTCGG AACCAATCCG 
CTTGCCTTCG CCGTGCCTTC GAAAGAAGGA ACGCCCGCCA TCCTCGTCGA TCAGAGCCTG 
AGTGCCGTCA CCAAAACCGA GATGATCCTG CGCCGCGACC GCGGCGAGGC GATCCCCGCC 
GGCTGGGCGC AGGACCGGAA TGGACAGCCG ACGACCGACG CGGCCATCGG GCTTGAAGGT 
TCGCTTCTGC CTGCCGGCGG TCGCAAGGGC GCCAATGTCG CCCTTCTTGT GGAGGTCCTT 
GCTGCCGCCC TGACCGGCTC GGTACTCAGC ACGGAGGCGA GCGCTTTCGG AAACGACGAG 
GGTGGGCCGC CGCATGTCGG CCAATTCCTG ATCGCCATCG ACCCTGGTCA CTTCTCGGCC 
GGTCGCTTCT CGGAAGCGAT CGACAATTTG GTCGCCTCCC ATGAGGCTGC CGGCGTAAGA 
CTTCCCGGCC ACTCCGGACG AAAGCAGGCC GTTTTCGTCG ATGCGGATCT TTGGAAGAAG 
GTCCGGTTGC TATCGGAACC GGAGGACACC CGGTAA

Protein sequence

MTTVELSREE IEAVCLAALT VHGAAAGNAR PVARAIAMAE AAGNRVCGLY YLPIFCRHLA 
IGKVDGGAIP EVSARGVTVT VDARSGFAHP AIAAGTPALI DLARSNGLGA MAVRNSYNCL 
ALGHHVHPLA DAGLIGICVS NAPAAVAPPG AAAALFGTNP LAFAVPSKEG TPAILVDQSL 
SAVTKTEMIL RRDRGEAIPA GWAQDRNGQP TTDAAIGLEG SLLPAGGRKG ANVALLVEVL 
AAALTGSVLS TEASAFGNDE GGPPHVGQFL IAIDPGHFSA GRFSEAIDNL VASHEAAGVR 
LPGHSGRKQA VFVDADLWKK VRLLSEPEDT R