Gene Rleg2_4662 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_4662
Symbol
ID	6977756
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	+
Start bp	298660
End bp	299913
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	60%
IMG OID	643393836
Product	extracellular solute-binding protein family 1
Protein accession	YP_002278654
Protein GI	209546736
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.917353
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGACCC TATCCGCGAA ATTGAAGACT GCGAGCATCG TTGCGATCGC CATGGCGTCT 
TTCGCCGCGA CGCCGGTTCT TGCCGAAGAC ATCACGCTCT GGACGCTCAA CTTCGACAAC 
AACGCCGCCA ACGGCGCGCT GAAGAAGGTC GCGACGGATT TCGAAGCGGC GAACCCGGGA 
ACGCATGTCG AGATCGTTCA GCGCGCCGTC GACGAGCACA AGACGGCGCT GCGCGTCGCA 
GCCGGCTCAG ACAAGGGGCC CGACATTTAT TTCAGCTGGG CGGGCCTTGG CCTCGGCGGC 
GAATATGTGA AGGCCGGCCT CTCCCTGCCG CTCGACAAAT ATTACAGCGA ATATAAATGG 
AACGACGAAT TGCTGCCCTC GGCTGCGGCT TTCGCCGACC TTTATCCCGG CGGCAAACAC 
GGCGTTCCCT TCACCTTCAA GGGCGAGGCC GTCTATTACA ACAAGAAGCT TTTCGAGCAG 
GCCGGCATCA AGGAAGAGCC AAAGACCTAT GAGGAACTTC TGGCCGCGGC CGACAAGCTG 
AAAGCCGCCG GCATTCCCGC CTTCACCTTC GGCGGCACGG TCAACTGGCA CGTCATGCGC 
CTGATGGATG TCATCCTCGA GACCAAGTGC GGCGCCGAGA AGCACGACGC GCTGAAGGCG 
ATGACGCTGG ACTGGACCAA GGAGCCTTGC GCGACGGACG CCTTTGCGGA ATTTGCCAAG 
TGGACGAAGG ACTATACGCT GCAGCCCTTC ATGGGCATCG ACAACAAGCA GTCCTACAGC 
CTCTTCACGG CAGGCCGCGC GGCGATGATG CTCGAAGGCG ACTGGCTGGT CAGCCAGCTC 
AACGGCTCGG GCGCCAATCT CGACGATTAC GGCATCTTCC CCTTCCCGAC CAATACCGAG 
CGTCTCTATG GTTTCGCCGA GTACAATTAC ATCAGCACCA AGAGCAAGAA TCCCGACACA 
GCCGCGAAAT TCCTCGACTA TTTCCTTTCG ACCAAGGTGC AGCAGGATCT GCTCGGCCAG 
CTGAGCTCGA CCTCCGTCAA CAAGAATGTC CAATACGCCA ACCAGAAGCC GCTCGAGGCG 
GAATGGCTGG GGATCTTCCA GAAATACGGC AAGGTCTACA TGAACGGCGA CCAGGCCTTC 
CCGCTCGATG TGACGACGGA ATATTTCCGC GTCATCAATG ACGTCGCCTC CGGCAACACC 
GAGCCGGCCG AGGCGGCCAA GCAGCTGCAG ACCTTCATCG CAAGCAGAAC CTGA

Protein sequence

MLTLSAKLKT ASIVAIAMAS FAATPVLAED ITLWTLNFDN NAANGALKKV ATDFEAANPG 
THVEIVQRAV DEHKTALRVA AGSDKGPDIY FSWAGLGLGG EYVKAGLSLP LDKYYSEYKW 
NDELLPSAAA FADLYPGGKH GVPFTFKGEA VYYNKKLFEQ AGIKEEPKTY EELLAAADKL 
KAAGIPAFTF GGTVNWHVMR LMDVILETKC GAEKHDALKA MTLDWTKEPC ATDAFAEFAK 
WTKDYTLQPF MGIDNKQSYS LFTAGRAAMM LEGDWLVSQL NGSGANLDDY GIFPFPTNTE 
RLYGFAEYNY ISTKSKNPDT AAKFLDYFLS TKVQQDLLGQ LSSTSVNKNV QYANQKPLEA 
EWLGIFQKYG KVYMNGDQAF PLDVTTEYFR VINDVASGNT EPAEAAKQLQ TFIASRT