Gene Rleg2_6542 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_6542
Symbol
ID	6983612
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011371
Strand	+
Start bp	215107
End bp	216453
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	61%
IMG OID	643399538
Product	extracellular solute-binding protein family 1
Protein accession	YP_002284294
Protein GI	209552379
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2182] Maltose-binding periplasmic proteins/domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.162087
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATTT TGCCGACACT GAAATCCCTC ACTATTGCTG CCGCCATCCT GGCCTCGAGC 
TCTGCAATCG TGCTTGCCAA GGACGTTCAC ATCAGCGTCT GGGCCGGCGG CACCGGCCCG 
AACGACGCCT ATCGCCTCGA CGCCATCGAA ATTGCAGCCC AGCAGCTGCA GCGCGAAGCC 
GCCCTCAAGG GCGAAGACCT GAAGATCACC GTCGAGAAGA AGCCCTATTC CGCCTGGGAA 
GACTTCAAGC AGGCGCTGAC CCTTGCCGCG GAAGCCAAGA CCGCCCCGAA CATCGTCGTC 
AGCGGCCACG AAGACATCGC CCCCTGGTCG CAGGCCGGCC TCATCGTCCC GATCGAGGAT 
TACGTCGATC TCGACTCCTG GCCGCTCAGC GACATCTACG AAAACCTGCT GAAGATCGCC 
TCCTACAACG GCACCGTCTA CGGCATTCCG CAGGATGCCG AATCCCGCCC GATGTTCTTC 
TGGAAGCCTT ATATGAAGGC GATCGGCTAC AGCGACGCCG ATCTGGATGC GCTGCCGCAG 
AGTGTCCAGG ACGGCAAGTA CACCATGAAA AACCTGCTCG AAGACGCCAA GAAGATGCAG 
GACAAGGGCC TCGTTCAGCC CGGTTACGGT TTCTATCCGC GCACCAGCAA CGGTCCCGAT 
TATTGGCAGT TCTACACCAG CTTCGGCGGT ACGATGGAAG AAGGCGGCAA GCTCGTCTTC 
GACAAGGCGG CGATGGCCCG CACCTATCAG TTCTTCGCCG ACGCCGTTAA ATCAGGCGTC 
ACCAAGAAGA ACCACATCGG CATGCCTGGT GATCAGTGGT GGAAGGAAGT CGCCACCGGC 
AAGGCAGGCA TCTGGGACGG CGGCACCTGG CATTATGCCC GCCTCGTCAA CCAGGAAGGC 
CTCAAGGACT TCTTCGGCAA CGTGATCTTC ACGCTGATCC CCGCCGGCGA AGGCGGCAAG 
GCCAACACGC TGACCCATCC GCTCGTCTAC CTCTTGACCG CAGGTCACGA TCAGGAAGAC 
ACCGAGATCG CCGCCCAGCT GGTCAAGATC GCCTCCGAGC CGCGCACCAA CGCGCTGCAT 
GCGGTCAAAT CGGCCCATCT CGGCATCTCC AAGTCGGAAG CCACCGTCGA CTTCTACTCG 
GCCGACCGCT GGACCCGCGA AGCCACCGAG CGCCTGCTGC CGCATGCCAA TGCAATGCCG 
AACAATTCCG ATTTCGGCAC CTATTGGAAC ATCATGTGGA AGAACCTCGA AGCCTCCTGG 
ACCGGCGCCA AGACCGTCGA CGCCGCCATC GGTGATGCCG AGAGCGAGCT GAAGAGCACG 
CTCGGCGACA AGATCGTCAT CCGCTGA

Protein sequence

MTILPTLKSL TIAAAILASS SAIVLAKDVH ISVWAGGTGP NDAYRLDAIE IAAQQLQREA 
ALKGEDLKIT VEKKPYSAWE DFKQALTLAA EAKTAPNIVV SGHEDIAPWS QAGLIVPIED 
YVDLDSWPLS DIYENLLKIA SYNGTVYGIP QDAESRPMFF WKPYMKAIGY SDADLDALPQ 
SVQDGKYTMK NLLEDAKKMQ DKGLVQPGYG FYPRTSNGPD YWQFYTSFGG TMEEGGKLVF 
DKAAMARTYQ FFADAVKSGV TKKNHIGMPG DQWWKEVATG KAGIWDGGTW HYARLVNQEG 
LKDFFGNVIF TLIPAGEGGK ANTLTHPLVY LLTAGHDQED TEIAAQLVKI ASEPRTNALH 
AVKSAHLGIS KSEATVDFYS ADRWTREATE RLLPHANAMP NNSDFGTYWN IMWKNLEASW 
TGAKTVDAAI GDAESELKST LGDKIVIR