Gene Rleg_5343 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5343
Symbol
ID	8007301
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	-
Start bp	751542
End bp	752603
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	63%
IMG OID	644822247
Product	Malate/L-lactate dehydrogenase
Protein accession	YP_002973507
Protein GI	241113672
COG category	[C] Energy production and conversion
COG ID	[COG2055] Malate/L-lactate dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.218988
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGATGC CGCTGATTGA CCGCATTGCC CTGACTCAAT TCGCAAAGCA GATATTGACC 
CGCGCCGGCA TGGAGGCCGA CAAGGCCGAA ACGACTGCCG CCGTCCTGGT GGAAGGCGAC 
ATGATCGGCC ACGAAACCCA TGGCGTCAGT CTTTTGAGCT GGTATGTCGA GGCGTTGGAA 
GACGGCTCGC TGGCAAAGTC CGGCAGCTAT GAGATCGTCA ATGACCGCGG CGCAGCCTTT 
GTTTGGGACG GCAAATCCCT GCCGGGCGCA TGGCTGCTGA CGAAGGCGAT CGAGCAGGCC 
TGCGAACGGG TCGGCGATCA TGGCGTCGTC ACCGCCGCGA TCCGCAACTG CCACCATACC 
TGCGCGCTTT CAGCCTTCAT GCGGCAGGTA ACCGAACGGG GCCTCATCGT ACAGCTGTCG 
GTCTCGCATC CCGCGGCGAG CCGCGTTGCG CCCTATGGCG GCACGAAGCC GCTTCTGACG 
CCCAACCCTA TGGCGGCCGG CTTCCCGACA TCTGCGGATC CGATCCTGAT CGACGTCTCG 
GCCTCGATCA CCACCACGAC CATGACGCAA AACCTGGCGA AGGCCGGCAA GAAATTTCCT 
GAGGCCTGGG CTTTCACTGT CGCAGGCGAG CCGACCGATG ATCCGCGCGA GGTGACGGAA 
CGGGGCGGGA CGATGATGCC TCTCGGCGGC CAGTTGAAGG GGCACAAGGG TTTTGGGCTC 
GGACTGATCG TCGAGTTGCT GGGGCAGGGG CTTTCCGGCA AGGGACGGGC GAACACGCCA 
TCCGGTGTCT TTTCGCAAAG CGCCTTCCTT CAGGTCATCG ATCCGGCCTT TTTTGCCGGG 
CTCGATGCCT TTACAGCGCA GTCTGACTTT CTCGCCTCTG CCTGCCGCAG CAATCCTCCG 
GCGCCCTGGA ACAATGGCCC CGTTCGCATG CCGGGCGACA GCGCAGCGCA AAAGCGCCGC 
TCGGCGTTAG AAGAGGGCGT GCCGGTCGGC GATGCAGCTT GGCAAAAGCT TTGCAAACAT 
GCCGAGATCC TAGGCTTGCC TATTCCCGAC GTCACCGCGT GA

Protein sequence

MPMPLIDRIA LTQFAKQILT RAGMEADKAE TTAAVLVEGD MIGHETHGVS LLSWYVEALE 
DGSLAKSGSY EIVNDRGAAF VWDGKSLPGA WLLTKAIEQA CERVGDHGVV TAAIRNCHHT 
CALSAFMRQV TERGLIVQLS VSHPAASRVA PYGGTKPLLT PNPMAAGFPT SADPILIDVS 
ASITTTTMTQ NLAKAGKKFP EAWAFTVAGE PTDDPREVTE RGGTMMPLGG QLKGHKGFGL 
GLIVELLGQG LSGKGRANTP SGVFSQSAFL QVIDPAFFAG LDAFTAQSDF LASACRSNPP 
APWNNGPVRM PGDSAAQKRR SALEEGVPVG DAAWQKLCKH AEILGLPIPD VTA