Gene Rleg_2286 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_2286
Symbol
ID	8013285
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	2293753
End bp	2295207
Gene Length	1455 bp
Protein Length	484 aa
Translation table	11
GC content	59%
IMG OID	644824871
Product	extracellular solute-binding protein family 1
Protein accession	YP_002976101
Protein GI	241205005
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.322369
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAAGAT TGCTATTGAG TTCAACGGCC GCAGGACTAC TTGCTGCGGC GGGCGTCACA 
TCCGCGCTCG CGTGCGAACC GGACTACACC GGTGTCACGC TCACCGCTAC GACGCAGACA 
GGCCCCTATA TCGCCTCTGC GCTACAACTC GCGGCCAAGG GCTGGGAAGA AAAGACCTGC 
GGCAAGATGA ATGTCGTCGA ATTTCCGTGG TCGGAACTCT ATCCGAAAAT CGTAACCTCG 
TTGACCTCGG GCGAAGACAC GTTCGACGTG GTCGCCTTTG CGCCGGCCTG GGCACCGGAC 
TTCACCGATT TTCTCTCGGA AATGCCCAAG GCGATGCAAT CAGGTGCCGA CTGGGAGGAC 
ATCGCGCCGG TTTACCGCGA GCAACTGATG GTTTGGAACG GCAAGGTCCT GTCGCAGACC 
ATGGACGGTG ACGCCCATAC CTATACCTAC CGCATTGATC TGTTTGAAAA CGCGGAAAAC 
CAGAGCGCCT TCAACGCGAA GTATGGCTAC GATCTGGCCC CACCGAAGAC ATGGAAGCAG 
TATCTCGACA TCGCTGAATT CTTCCAGCAG CCGGACAAGG GCCTTTGGGG CACGGCGGAA 
GCCTTCCGCC GTGGTGGCCA GCAATTCTGG TTCCTGTTCA GTCACGTGGC GGGATACACC 
AGCCATCCCG ACAATCCCGG CGGCATGTTC TTCGATCCTG ACACGATGGA TGCGCAGGTC 
AACAATCCAG GCTGGGTGCG CGGCCTGGAG GAATATATTC GCGCCTCCAA ACTGGCACCG 
CCAAATGCGC TGAACTTCTC GTTCGGCGAA GTGAACGCAG CCTTTGCCGG TGGCCAGGTC 
GCGGAATCGA TCGGCTGGGG CGATACCGGC GTCATCGCCG CCGACCCGAA GCAGTCCAAG 
GTTGCTGGCA ATGTCGGTTC GGCATCGCTG CCGGGATCCG ACGAGATCTG GAACTACAAG 
ACCAAAAAGT GGGACAAGCA GCCCGAGGTC GTCCAGACTT CCTTCATGGC CTTCGGCGGT 
TGGCAGGCAG CCGTACCGTC GTCCTCCAAG AACCAGGAGG CCGCTTGGAA CTATATCCAG 
TTCCTGACGA GCCCGGCGGT TTCCGGTCAG GCGGCGATTA CCGGCGGCAC AGGCGTCAAT 
CCATACCGTC TTTCGCACAC GACGAATACA GCGTTGTGGT CGAAGATCTT TTCCGAGCGT 
GAGGCCAAGG AATATCTTGG AAGCCAGAAG GACGCGGTGA CCGCCAAGAA CACGGCGCTC 
GACATGCGCC TGCCGGGCTA TTTCTCCTAT ACGGAAATTC TCGAAATCGA GCTTTCCAAG 
GCATTGGCTG GAGAGGTGAC GCCGCAGCAG GCGCTGGATA CCGTGGCTGC CGGATGGAAC 
AAGCTGACGG ACGAGTTCGG CCGCGACAAG CAACTGGCAG CCTATCGTTC GTCGATGGGC 
CTGCCTGCGA AGTAA

Protein sequence

MRRLLLSSTA AGLLAAAGVT SALACEPDYT GVTLTATTQT GPYIASALQL AAKGWEEKTC 
GKMNVVEFPW SELYPKIVTS LTSGEDTFDV VAFAPAWAPD FTDFLSEMPK AMQSGADWED 
IAPVYREQLM VWNGKVLSQT MDGDAHTYTY RIDLFENAEN QSAFNAKYGY DLAPPKTWKQ 
YLDIAEFFQQ PDKGLWGTAE AFRRGGQQFW FLFSHVAGYT SHPDNPGGMF FDPDTMDAQV 
NNPGWVRGLE EYIRASKLAP PNALNFSFGE VNAAFAGGQV AESIGWGDTG VIAADPKQSK 
VAGNVGSASL PGSDEIWNYK TKKWDKQPEV VQTSFMAFGG WQAAVPSSSK NQEAAWNYIQ 
FLTSPAVSGQ AAITGGTGVN PYRLSHTTNT ALWSKIFSER EAKEYLGSQK DAVTAKNTAL 
DMRLPGYFSY TEILEIELSK ALAGEVTPQQ ALDTVAAGWN KLTDEFGRDK QLAAYRSSMG 
LPAK