Gene Rleg2_5608 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_5608
Symbol
ID	6978702
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	-
Start bp	1254478
End bp	1255761
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	61%
IMG OID	643394706
Product	extracellular solute-binding protein family 1
Protein accession	YP_002279524
Protein GI	209547606
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.959607
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACATC GGATAAAGCG CATTCTTGCG GGCGCATCCA CGCTTCTGGC GTTGGCCGCG 
GCCGGCCCGT CGCATGCAGA AACCACGCTG TCTTTCCTGA TCGACAACAA TCCCGACACG 
GTCGCAGCAG CCGAGGCCTT GGTTGCCGCC TATCAGACCA AGGCGCCCGG CGTGACGATC 
GAAATCGAAC AGCGGCCGGG CGGCGGCGAG GGCGACAACA TCATCAAGAC GCGCCTGGCG 
ACGGGGGAGA TGTCCGATGT ATTCCTCTAT AATTCGGGTT CGCTCTTGCA GGCGCTGAAG 
CCCACGCAGA AACTGGTCGA TCTGAGCGGC CTGCCGTCAC AGGCAAAGGT GGACGAAAGC 
TTCAAGGCGG TGGTCAGCGC CGACGGCAAG CTCTATGGCG TTCCCTTCGG CACGGCGATG 
GCCGGCGGGA TCCTCTACAA CAGGAAGATC TATCAGGATC TCGGCCTCTC CGTTCCGAAG 
ACATGGGCGG ATTTCATGGC GAACAACGCC AAGGTCAAGG CATCCGGCAA GGTCGCCGTG 
GCGCAGACCT ATCGCGATAC GTGGACCTCG CAGCTGTTCG TTCTGGCCGA TTATTACAAT 
CTGCATGCCG CCGTGCCGAA CTTTGCCGCC GACTATACCG CCAACAAGGC GAAATATGCC 
GAGACGCCGG CGGCAATGAA GGGCTTCGAA CGGCTGAAGG ACGTTCATGA TGCCGGCCTG 
ATGAACGAAG ACTTCGGCGC GGCAAGCTAC GACGACGGCT TGAGAATGGT GTCGACCGGC 
GAGGCAGCGC ATTATCCGAT GCTGAGCTTC GCAGTCAGCG CGCTCAAGCA GAATTATCCG 
GAGAACCTCG CAGATGTCGG CTTCTTCGCC CAGCCGAGCG ACGATGCCGC AACGAACGGC 
CTGACGGTCT GGATGCCGCC GGGCCTTTAC ATTCCTGCGA CCAGTCAGCA TGCCGAGGAA 
GCGAAAAAAT TCGTCGATTT CGCCGGGAGC GTCGAGGGCT GCAAGATCAT GGTGGAAACC 
AACGCGGTCC AGGGCCCCTC CCTGGTCGAC GGCTGCGACC TGCCTGCCGA CGTGCCGCCG 
GCGATCAAGG ATATGCTTCC CTATTTCGAG GCCAAGGACA AGACGACCCC GGCCCTGGAA 
TTCGTTTCTC CCGTCAAGGG ACCGGCGCTC GAGCAGATCA CCGTCGAGGT CGGCTCCGGC 
ATTCGCCAAC CAGCCGAGGC GGCGAAACTC TATGATGAGG ATGTGCGCAA GCAGGCCAAG 
CAGCTCGGCC TGCCCAACTG GTAG

Protein sequence

MTHRIKRILA GASTLLALAA AGPSHAETTL SFLIDNNPDT VAAAEALVAA YQTKAPGVTI 
EIEQRPGGGE GDNIIKTRLA TGEMSDVFLY NSGSLLQALK PTQKLVDLSG LPSQAKVDES 
FKAVVSADGK LYGVPFGTAM AGGILYNRKI YQDLGLSVPK TWADFMANNA KVKASGKVAV 
AQTYRDTWTS QLFVLADYYN LHAAVPNFAA DYTANKAKYA ETPAAMKGFE RLKDVHDAGL 
MNEDFGAASY DDGLRMVSTG EAAHYPMLSF AVSALKQNYP ENLADVGFFA QPSDDAATNG 
LTVWMPPGLY IPATSQHAEE AKKFVDFAGS VEGCKIMVET NAVQGPSLVD GCDLPADVPP 
AIKDMLPYFE AKDKTTPALE FVSPVKGPAL EQITVEVGSG IRQPAEAAKL YDEDVRKQAK 
QLGLPNW