Gene Rleg2_2637 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_2637
Symbol
ID	6981380
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	2683507
End bp	2684610
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	61%
IMG OID	643397349
Product	extracellular solute-binding protein family 1
Protein accession	YP_002282134
Protein GI	209550217
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.142963
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCTCTA ACATTTCTCG ACTTCTGTCG CTCTCTACTG CGATGATCGT GGCTTCGACC 
GCGATTGCCG CCGCCGAGCC GAGCGCTGAA CTTATCGCCG CCGCCAAGAA GGAAGGCACC 
CTGACCACGA TCGCTCTTCC GCACGACTGG TGCGGCTACG GCGACGTCAT TGCCGGCTTC 
AAGGCCAAGT ATGGCCTCGA AGTCAACGAA CTGAACCCGG ACGCCGGTTC GGGCGACGAA 
GTCGAAGCCA TCAAGGCCAA CAAGGGCAAC ACCGGGCCGC AGGCTCCTGA CGTCATCGAC 
GTCGGCCTCT CCTTCGGTCC GTCCGCCAAG AAGGACGGCC TGATCCAGCC TTACAAGGTT 
TCCACCTGGG ATTCGATCCC GGACACGGCC AAGGATGCCG AAGGCTTCTG GTACGGCGAC 
TATTACGGCG TTCTCTCGTT CCTCGTGAAC AAGGACCTCG TCAAGGAATC GCCGGCCGAC 
TGGACCGACC TTAAGAAGAG CGACTACGCA AACACCGTCG CGCTTGCAGG CGATCCGCGC 
AGCGCCAACC AGGCCGTCCA AGGCGTCTAT GCCGCTGGTC TTTCCGCATC CGGCGGTGAC 
GCGGCCAAGG CAGGCGAAGA AGGCCTGAAG TTCTTTGCCG AACTCAACAA GGCTGGCAAC 
TTCGTGCCCG TCGTCGGCAA GGCTGCTCCC TTCGCGCAGG GCTCGACGCC GATCATCGTC 
GCCTGGGACT ACAATGCCCT GTCCTGGGGC CAGAGCCTCA AGGGCAATCC TCCGTTCGAG 
GTTGTCGTTC CGAAGACGGG CGTCGTTGCC GGTGTCTACG TCCAGGCGAT TTCCGCCTTC 
GCTCCGCACC CGAACGCTGC CAAGCTCTGG ATGGAATACC TCTATTCCGA CGAAGGTCAG 
CTCGGCTGGC TGAAGGGCTA TTGCCACCCG ATCCGCTTCA ACGATCTTGC CAAGAACAAC 
AAGATCCCGA AGGACCTGCT CGACAAGCTG CCGCCGGCAG CAGCCTATGA AAAGGCTGTT 
TTCCCGACGC TCGAAGAGCA GGCCGCCGGC AAGGAAACCA TCACCAAGAA CTGGGATTCC 
GTGGTTGGCG CCAGCGTCAA GTAA

Protein sequence

MISNISRLLS LSTAMIVAST AIAAAEPSAE LIAAAKKEGT LTTIALPHDW CGYGDVIAGF 
KAKYGLEVNE LNPDAGSGDE VEAIKANKGN TGPQAPDVID VGLSFGPSAK KDGLIQPYKV 
STWDSIPDTA KDAEGFWYGD YYGVLSFLVN KDLVKESPAD WTDLKKSDYA NTVALAGDPR 
SANQAVQGVY AAGLSASGGD AAKAGEEGLK FFAELNKAGN FVPVVGKAAP FAQGSTPIIV 
AWDYNALSWG QSLKGNPPFE VVVPKTGVVA GVYVQAISAF APHPNAAKLW MEYLYSDEGQ 
LGWLKGYCHP IRFNDLAKNN KIPKDLLDKL PPAAAYEKAV FPTLEEQAAG KETITKNWDS 
VVGASVK