Gene Rleg_0387 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_0387
Symbol
ID	8011592
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	394953
End bp	396314
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	61%
IMG OID	644822982
Product	extracellular solute-binding protein family 1
Protein accession	YP_002974237
Protein GI	241203141
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAGT CATTTTTGAT GGGCGTTGCC GTGGCAGCGC TTTTTGCCGG TGCTGCGTCC 
GCGGCCGATT TGAAATTTGC CCCGGGGCAG GATTCCAAGT TCAACTGGAA GAGCTATGAC 
GAGTTCAAGG CTGCGCATGC CGATCTGAAG GGTCAGCCGC TGACGATCTT CGGGCCGTGG 
CGCGGCGAGG ACGAGGCGTT CTTCATGAGC GTGCTTGCCT ATTTCACCGA AGCCACCGGC 
ATCGATGCCA AATACTCGTC TTCCGAAAAC TACGAACAGC AGATCGTTAT CGACACGCAG 
GCGGGCTCGC CGCCGAACAT TGCCGTTCTG CCGCAGCCCG GCCTCCTGGC CGATCTCGCC 
AGCAAGGGCT TCCTGACGCC GCTCGGCGAT GACAACTCCA AGTGGATCAA GGACAATTAC 
GGCGCCGGCG ACAGCTGGGT CGGTTACGGT ACCTACAAGG GCAAGGACGG CAAGGAAGCC 
TTCTACGCCT TCCCGTATAA GGCCGACGTA AAATCGCTGG TCTGGTACGT GCCGGAGAAT 
TTCGAGGAAG CCGGTTACAA GATCCCGACG ACCATGGAAG AACTGCATGC CCTGACCGAC 
CAGATCGTCA AGGACGGCGG CGTTCCCTGG TGCATCGGAC TCGGTTCCGG CGGCGCCACC 
GGCTGGCCGG CGACCGACTG GGTCGAGGAC ATCATGCTGC GCATGCAGCC GCCGGAAGCC 
TACGACAAGT GGACGACCAA CGAGCTGAAG TTCACCGATC CGGCGGTCGT TGCCGCGATC 
GACGAGTTTG GCAAGTTCGC CAAGAACGCG AAATACGTCG ATGGCGGCGT CGCAGCCGTG 
GCCTCGACCG ATTTCCGCGA CAGCCCGAAG GGCCTCTTCG CGGTTCCGCC GAAGTGCTAC 
ATGCACCATC AGGCCTCGTT CATCCCGTCC TTCTTCCCTG AAGGCACGAA GCTCGGTCAG 
GATGCCGACT TCTTCTACAT GCCGACCTTT GCGTCGCATC CCGAACTCGG CAAGCCGGTT 
CTCGGCGCCG GCACGCTCGT CTCGATCGCC AAGGACTCGA AGACGGCCCG CGCCTTCATC 
GACTTCCTGA AGACCCCGAT CGCCCATGAG GTCTGGATGG CGCAGTCGAG CTTCCTGACG 
CCGTATAAGG GCGTCAGCAC CGAGGCCTAT GCCAACCCGC AGATGAAGAA GGAAGGCGAT 
ATCCTGACCT CGGCCACCAC CTTCCGCTTC GACGGTTCCG ACCTGATGCC GGGCAAGATC 
GGCGCCGGCG CCTTCTGGAC TGGCATGGTC GATTTCGTCG GCGGCAAGTC CGCTGAAGAG 
GCCGCTGGCG AAATCCAGAG CGCCTGGGAC GGCATCAAGT AA

Protein sequence

MKKSFLMGVA VAALFAGAAS AADLKFAPGQ DSKFNWKSYD EFKAAHADLK GQPLTIFGPW 
RGEDEAFFMS VLAYFTEATG IDAKYSSSEN YEQQIVIDTQ AGSPPNIAVL PQPGLLADLA 
SKGFLTPLGD DNSKWIKDNY GAGDSWVGYG TYKGKDGKEA FYAFPYKADV KSLVWYVPEN 
FEEAGYKIPT TMEELHALTD QIVKDGGVPW CIGLGSGGAT GWPATDWVED IMLRMQPPEA 
YDKWTTNELK FTDPAVVAAI DEFGKFAKNA KYVDGGVAAV ASTDFRDSPK GLFAVPPKCY 
MHHQASFIPS FFPEGTKLGQ DADFFYMPTF ASHPELGKPV LGAGTLVSIA KDSKTARAFI 
DFLKTPIAHE VWMAQSSFLT PYKGVSTEAY ANPQMKKEGD ILTSATTFRF DGSDLMPGKI 
GAGAFWTGMV DFVGGKSAEE AAGEIQSAWD GIK