Gene Rleg_2141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_2141
Symbol
ID	8013159
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	2130543
End bp	2131961
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	65%
IMG OID	644824727
Product	transcriptional regulator, GntR family with aminotransferase domain
Protein accession	YP_002975957
Protein GI	241204861
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.196836
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.113478
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAAATT GGCTTCCCGA TATTTCCCGC GGTTCCGGGC CGGTCTATCT CCGGCTTGCC 
GACAGCATCG AATCCGCCAT ATCAAGCGGC GCCCTGCCCG CCGGCAGCAA GCTGCCGCCG 
CAACGCAACC TCGCCTATGA TATTGGCGTG ACGATCGGCA CGATCGGCCG CGCCTATGCG 
CTGGTGCATG AGCGCGGCCT GGTCGCCGGC GAAGTGGGGC GCGGCACCTA TGTGCTGAAC 
CGCTCCGAAA CGCCGCCCGG CGAACAGATC GATCCGCTAA CCGTCTCGCT CGGCGGCACC 
CGCGTCCAGG ATGCGCCGGC GAACAAGATC CGCTTCGACA CGACAGCCGC TCCCGATCTC 
GGCCAGGGCA AGATCATAGC AGGCATCCTC GCCGAGATCG GCGAGCAGCA TCTTGCCGAA 
ATTTCCTCCT ATTCCCGGAG CTTCCCGCGC AACTGGTTCG AGGCCGGCCG CCTGTGGCTT 
GCCCGCAGCG GCTGGACGCC GGAGGTCGAA AACATCGTGC CGACGCTCGG CGCTCATGCA 
GCGGCGATAT CAGTCATCGC CGCTGTCTCG GCGCCGGGCG ACAAGATCGT CTTCGAGGAT 
CTCACCTATA CCCAGGTCAG CCGCAGCGCC CGCCTGCTCG GCCGCCGCAC GCTGACGGTC 
GATTCCGATG AACTCGGCGT GATCCCGGAG GATTTCGAGC GGCTCTGTCA GCAGCAGCAT 
CCGAAGATCG CCTTCCTGAT GCCGACCGTC CACAATCCGA CGCTGGCGAT CATGCCCTAT 
GAGCGGCGCG CGGCCATCGC CGCAATCGCC AGGAAACATA GTGTCTGGCT GATCGAGGAC 
GACCTCTACG GCGGCATGGC CGACGACGAT ACGCCGCTGC TCGCCTCGAT TGCGCCCGAT 
CGCACCTTCC TCGTCAACGG CCTGTCGAAA TCGGTCGCCG CCGGCGTGCG CGGTGGCTGG 
GTCGCCTGCC CGCCGCATTT TGCCCAGCGC ATCAAGGTGA CGCACAGGAT GATCACCGGC 
GGTCTGCCGT TCATTCTGGC GGAGACCTGT GCGCGCCTCG TCGAAAGCGG CATGGCGCAC 
GAGATCCGCA AGGCAAGTGT CGAGGAACTT TCCCGGCGGG TCCGGCTCGC CCGCGAGCAG 
CTGCAGGGCT TCGATTTCGA ATCGCACGTA CACGCGCCCT TCCTCTGGCT GAAACTGCCG 
GAACCCTGGA TGTCCGGCAC CTTCAAGAAT GCCGCCTTCC GCGACGGCGT GCTCGTCGAC 
GACGAGGACG AGTTCAAGTC GGCGCGCGGA GAGAGGCCCT ATCATCGCGT TCGCATCGGT 
TTTTCCTCGC CGAAGACCGG GCAGGAACTG ATCTCGGGCC TGATGATCCT GCGCCGTCTG 
CTGGAAAACG GCGGCTCCGC CTATGATGGC GAAATATGA

Protein sequence

MTNWLPDISR GSGPVYLRLA DSIESAISSG ALPAGSKLPP QRNLAYDIGV TIGTIGRAYA 
LVHERGLVAG EVGRGTYVLN RSETPPGEQI DPLTVSLGGT RVQDAPANKI RFDTTAAPDL 
GQGKIIAGIL AEIGEQHLAE ISSYSRSFPR NWFEAGRLWL ARSGWTPEVE NIVPTLGAHA 
AAISVIAAVS APGDKIVFED LTYTQVSRSA RLLGRRTLTV DSDELGVIPE DFERLCQQQH 
PKIAFLMPTV HNPTLAIMPY ERRAAIAAIA RKHSVWLIED DLYGGMADDD TPLLASIAPD 
RTFLVNGLSK SVAAGVRGGW VACPPHFAQR IKVTHRMITG GLPFILAETC ARLVESGMAH 
EIRKASVEEL SRRVRLAREQ LQGFDFESHV HAPFLWLKLP EPWMSGTFKN AAFRDGVLVD 
DEDEFKSARG ERPYHRVRIG FSSPKTGQEL ISGLMILRRL LENGGSAYDG EI