Gene Rleg_6631 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_6631
Symbol
ID	8022881
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012858
Strand	-
Start bp	59912
End bp	61144
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	60%
IMG OID	644833498
Product	extracellular solute-binding protein family 1
Protein accession	YP_002984632
Protein GI	241666548
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.325237
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCATAT CAATCAAGAC AGGCCTTATG GCGCTCGCCC TGCTCGGTTC GACGGCACTG 
ACGGCCGTCA CTGCCCAGGC AGCCGACAAG GAAATCAGCT GGATCTATTG CGGCGACACG 
ATCGACCCGG TCCACACCAA ATACATCAAG CAGTGGGAAG AAAAGAACAC GGGCTGGAAG 
ATTGCCCCTG AGGTCGTCGG ATGGGCACAG TGCCAGGACA AGGCAACGAC GCTCGCTGCC 
GCCGGTACGC CGGTGGCGAT GGCCTATGTC GGCTCGCGCA CGCTGAAGGA ATTCGCGCAG 
AACGACCTTA TCGTTCCTGT GCCGATGACG GACGACGAGA AGAAGACCTA CTATCCGAAC 
ATCGTCAACA CCGTGACCTT CGAGGGCTCA CAGTGGGGCG TTCCGATCGC CTTCTCTACC 
AAGGCGCTCT ATTGGAACAA GGATCTCTTC AAGCAGGCCG GCCTCGATCC CGAGACGCCG 
CCGAAGACCT GGGCTGAAGA AATCGAGATG GCAAAGACCA TCAAGGAAAA GACCGGCATT 
CCGGGCTTCG GTCTCTCCGC CAAGACCTTC GACAACACGA TGCACCAGTT CATGCATTGG 
GTTTACACCA ACAACGGCAC GGTGATCGAT GCCGACGGCA AAGTTACGCT CGACAGCCCG 
CAGATACTCG CCGCGCTAAA GGCCTACAAG GATATCGTCC CCTACTCCGA AGAAGGCCCG 
ACGGCCTACG AGCAGAACGA AGTCCGCGCC ATCTTCCTCG ACGGCAAGGT GGCGATGATC 
CAGGCAGGAT CGGGTGCAGC CGACCGCCTG AAGGCGACGA AGATCAGCTG GGGCATCACG 
ACGCTGCCGC TCGGTCCCGA CGCCAAGGGT CCCGGCACGC TGCTGATCAC CGACAGCCTG 
GCGATCTTCA AGGGTTCGGG GGTCGAGGAC AAGGCGACGG AATTCGCCAA GTTCATCACC 
TCGCCCGATG TGCAGTCCGA ATACGAATTG CAGGGCGGCG CCGGCCTCAC CCCGCTGCGG 
CCGTCTGCAA AGGTCGATGA ATTCGTCGCC AAGGATCCCC ATTGGAAGCC GCTCATCGAC 
GGCATCAGCT ACGGTGGTCC CGAGCCGCTC TTCACCGACT ACAAGGGCTT CCAGAACTCG 
ATGATCGAGA TGGTACAGTC CGTGGTGACG GGCAAGGCCG AGCCGGAGGC TGCTCTCAAG 
AAGGCTGCCG GCGAAGTCGA GGCGTTCAAG TAA

Protein sequence

MSISIKTGLM ALALLGSTAL TAVTAQAADK EISWIYCGDT IDPVHTKYIK QWEEKNTGWK 
IAPEVVGWAQ CQDKATTLAA AGTPVAMAYV GSRTLKEFAQ NDLIVPVPMT DDEKKTYYPN 
IVNTVTFEGS QWGVPIAFST KALYWNKDLF KQAGLDPETP PKTWAEEIEM AKTIKEKTGI 
PGFGLSAKTF DNTMHQFMHW VYTNNGTVID ADGKVTLDSP QILAALKAYK DIVPYSEEGP 
TAYEQNEVRA IFLDGKVAMI QAGSGAADRL KATKISWGIT TLPLGPDAKG PGTLLITDSL 
AIFKGSGVED KATEFAKFIT SPDVQSEYEL QGGAGLTPLR PSAKVDEFVA KDPHWKPLID 
GISYGGPEPL FTDYKGFQNS MIEMVQSVVT GKAEPEAALK KAAGEVEAFK