Gene Rleg_6261 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_6261
Symbol
ID	8016132
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012852
Strand	-
Start bp	325691
End bp	326977
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	58%
IMG OID	644827564
Product	extracellular solute-binding protein family 1
Protein accession	YP_002978764
Protein GI	241258880
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.689417
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCTCG GATTGGCAAA TGCAGGCGAC GCCAGTGCAG CTGATCGCGT CAAGATCGAG 
TGGTGGAACG CAGCAAACGG CCGCCTGGCC GAGATCACCA AACAGCTGAT TTCGGACTTC 
AATGCCTCGC AGGACAAATA TGAGCTCGTT GGCATCAGCA AAGGCAATTA CGAGGAAACC 
ATGGCGGCGA TGGTGGCTGC CTATCGCGTC GGTCAGCAGC CCGTGCTTAT CCAAGCCGCC 
GAGCGAGGCT TTCTGACCAT GTATAATTCC GGCGCCATCA TCCCGGTGCC GGAGCTTATG 
GAGAAGGAAG GCTACAAGAT CGACTGGGGC AATTTCATCG CTCCGGTCGC GGGCTTTTAT 
CTCGTTGACG GCAAGCCGGC GGCAATGCCC TTCAACAGCT CGACACCGAT CTTCTGGTAC 
AATGCCGATC ACTTCAAGGC AGCCGGCTTC GACAAGCCGG CCGAGACCTG GCAGGAACTC 
GACAAGCAGT TGCACGCCAT CAAGGAGAAG GGAATTTCAA AGTGCCAGAT GGCGCTTGCG 
AACGACTTCT ATTGGAGCCT GATCGAGAAC TACGCCGCGA TCCAGGACCA GCCTTACGGT 
ACCAAGGCAA ACGGCTTCGG TGGTCTCGAT ACCGAATTCA TCTTCAACAA GAGCCCGCTG 
ATCGTCGGCC AGGTGACACG CCTCAAGACG TGGCTCGACG ATGGGGTCCT GCAGATCGCA 
GGGCAAGGCC TCTCACCCGA CCAGCTGTTT ACCTCTGGCA GTTGCTCGAC CTATGTGGCC 
TCGACCGCGG CGCATGCCGC TGTTGAAAGC GGTGCGAAAT TTCAATGGAG CGCGACGTTC 
CTGCCGCATG AGGAGGGCAT CGAGCCTAAG AACAGCACCA TTGGCGGCGG AGCGCTTTGG 
GTGTTGAAAG GCAAGTCGGA CGAAGAATAC GCAGGCACTG CGGCCTTCTT GAATTTTGTC 
GCCTTGCCGA AGACACAAGT CTGGTGGAGC AAGCAAACCG GCTATGTCCC GGTGACCAAT 
GCCGCCTACG AAGAGGCCAA ATCCGAGGGT TATTTCAAGG AGCATCCGAC CCGCGAGGTC 
GCCATTCTCC AACTCACGCG CGGCACGCCA ACCGACAATT CGCGCGGCTT CCGCTTTGGC 
AATCACAACC AGTCGATGGC GCTTCTGGTT GAGGAGATCC AAGGCGTGTG GACCGGACAA 
AAGACGCCGC AGCAGGCACT GGATGCTGCG GCGGCCCGCG GAAACCAGAT CCTTCGGCAG 
TATGAGCAGC TTCATGCAGC AAAGTAA

Protein sequence

MTLGLANAGD ASAADRVKIE WWNAANGRLA EITKQLISDF NASQDKYELV GISKGNYEET 
MAAMVAAYRV GQQPVLIQAA ERGFLTMYNS GAIIPVPELM EKEGYKIDWG NFIAPVAGFY 
LVDGKPAAMP FNSSTPIFWY NADHFKAAGF DKPAETWQEL DKQLHAIKEK GISKCQMALA 
NDFYWSLIEN YAAIQDQPYG TKANGFGGLD TEFIFNKSPL IVGQVTRLKT WLDDGVLQIA 
GQGLSPDQLF TSGSCSTYVA STAAHAAVES GAKFQWSATF LPHEEGIEPK NSTIGGGALW 
VLKGKSDEEY AGTAAFLNFV ALPKTQVWWS KQTGYVPVTN AAYEEAKSEG YFKEHPTREV 
AILQLTRGTP TDNSRGFRFG NHNQSMALLV EEIQGVWTGQ KTPQQALDAA AARGNQILRQ 
YEQLHAAK