Gene Rleg_2094 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_2094
Symbol
ID	8013118
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	2085176
End bp	2086144
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	62%
IMG OID	644824681
Product	short-chain dehydrogenase/reductase SDR
Protein accession	YP_002975911
Protein GI	241204815
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.26328
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.398139
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGGAC TTTTTGGCGC GACATCGACC ACCGATGAGG TGCTCGCCGG CGTCGATCTC 
AAGGGCAAGC GTGTTCTGGT GACGGGTGTT TCGGCCGGCC TCGGCGTGGA AACCGCGCGT 
GTGTTGGCAG CCCATGGAGC GCAGGTGACG GGTACGGCAC GTGACCTTGC AAAGGCGAGG 
GCGGCAACGG AAGTCGTGCG TGCCGGTGCG GCCAATGGCG GCAGCCTTGA TATCGTCGAG 
CTTGATCTTG CCTCTCTGGC AAGCGTGCGC GCCTGTGCCG ATGCGCTCAT TTCGGATGGC 
CGGCCCTTCG ATGTCGTCAT TGCCAATGCC GGCGTGATGG CCGCTCCCTT CGGCCGCACC 
GCCGATGGCT TCGAAACGCA GTTCGGCACC AACCATCTCG GTCATTTCGT GCTGGTCAAC 
AGCATCGCAC CGCTCGTCAA ATCGGGCGGC CGAGTGGTGA TCGTCGCATC CTCGGGCCAT 
CGCATGGCAC CTTTCAGCCT CGATGACCTC AATTTCGAGA GCAAGACCTA TGAGCCCTGG 
GCGGCCTATG CCCAGTCGAA AACCGCAAAT ATCCTGTTCG CGGTGGAACT CGACCGGCGC 
CTCAAGGAGC GCGGCATCCG TGCAACGGCA CTGCATCCCG GCGGCATCCA GACCGAGCTC 
GACCGTCATC TCGACCCTGA CATGATTGAA GGCATGATAA CGCAGATCAA CGCAGCACTC 
TCCGCCGAGG GCAAGCCGCC TTTCCAGTGG AAGACGATTC CTCAGGGTGC GGCTACCTCC 
GTCTGGGCAG GTTTCGTCGC CCCTGCAGAC GCGGTCGGTG GCAGATATTG CGAGAATTGC 
CACGTCTCCG AAGTGACGGA TGCGGAGATC AGCCCGATTT CCGAAGGCGT GCGTACCTAC 
GCGCTCGATC CCGAGACGGC CAGGGGATTG TGGACGAAAA GCGAGCATAT GGTCGGCGAG 
CGCTTCTAG

Protein sequence

MSGLFGATST TDEVLAGVDL KGKRVLVTGV SAGLGVETAR VLAAHGAQVT GTARDLAKAR 
AATEVVRAGA ANGGSLDIVE LDLASLASVR ACADALISDG RPFDVVIANA GVMAAPFGRT 
ADGFETQFGT NHLGHFVLVN SIAPLVKSGG RVVIVASSGH RMAPFSLDDL NFESKTYEPW 
AAYAQSKTAN ILFAVELDRR LKERGIRATA LHPGGIQTEL DRHLDPDMIE GMITQINAAL 
SAEGKPPFQW KTIPQGAATS VWAGFVAPAD AVGGRYCENC HVSEVTDAEI SPISEGVRTY 
ALDPETARGL WTKSEHMVGE RF