Gene Rleg2_3423 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_3423
Symbol
ID	6982177
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	3540127
End bp	3541287
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	62%
IMG OID	643398141
Product	extracellular solute-binding protein family 1
Protein accession	YP_002282916
Protein GI	209550999
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCATC TCTTGAAATC CTGCACGGCA GCGCTCGCCT GCCTGAGCTT CGCGACGCAG 
GTGATTGCCG CCGAGCCGCT GAAGGCGCTC GGCAAGGGCG AAGGAGCGGT CAGCATTGTC 
GCTTGGGCCG GCTATATCGA ACGCGGCGAA ACCGACAAGA ACTACGACTG GGTGAGCGAT 
TTCGAAAAGG AGACCGGCTG CAAGGTTTCC GTCAAGACCG CCGCCACCTC GGATGAAATG 
GTATCGCTGA TGAACGAGGG CGGCTTCGAC CTCGTCACCG CATCGGGCGA CGCGTCGCTC 
CGCCTCATCG CCGGCAAGCG TGTCCAGCCG ATCAACACCG ATCTGATCCC GAGCTTCAAG 
ACGGTCGACG AGCGCCTGCA GAAAGGTCCG TGGTATACGG TCGGCGACGT GCATTACGGC 
GTGCCCTATC TCTGGGGGCC GAATGTGCTG ATGTATAATA CCGATGCCTT CAAGGACAAG 
GCGCCGACCA GCTGGAATGT CGTCTTCGAG GAGCAGACCC TGCCCGACGG CAAGTCGAAC 
AAGGGCCGCG TCCAGGCCTA TGACGGCGCA ATCTATATCG CCGACGCCGC CCTGTACCTG 
ATGGCCCACA AGCCGGATCT CGGCATCAAG GACCCTTACG AACTGACTGA AGACCAGTAC 
AAGGCGGCCC TCGACCTGCT GCGCGGCCAG CGCAAGCTCG TCTCCCGCTA CTGGCACGAT 
GCGATGATCC AGATCGACGA CTTCAAGAAT GAAGGCGTCG TCGCCTCCGG CTCCTGGCCT 
TTCCAGGTCA ACCTGCTGCA GGCCGACAAG CAGAAGATCG CCTCCACATT CCCGGATGAA 
GGCGTCACCG GCTGGGCCGA CACCACCATG CTGCATGTCG ACAGCGAACA TCCGAACTGC 
GCCTATATGT GGATGGAGCA TTCGCTGCAG GCCAAGGTCC AGGGCGACGC CGCCGCCTGG 
TTCGGCGCCG TGCCCTCGGT TCCCGCCGCC TGCAAGGGCA ACGAACTGAT GGGCGACGCC 
GGCTGCGCCA CCAACGGCTT CGATCACTTC GACAAGATCA AGTTCTGGAA AACCCCGGTC 
GCCAAATGCA CGACGCAGAG CGAATGCGTG CCCTATCATC GCTGGGTGTC GGATTATATC 
GGCGTGATCG GCGGGCGGTA A

Protein sequence

MTHLLKSCTA ALACLSFATQ VIAAEPLKAL GKGEGAVSIV AWAGYIERGE TDKNYDWVSD 
FEKETGCKVS VKTAATSDEM VSLMNEGGFD LVTASGDASL RLIAGKRVQP INTDLIPSFK 
TVDERLQKGP WYTVGDVHYG VPYLWGPNVL MYNTDAFKDK APTSWNVVFE EQTLPDGKSN 
KGRVQAYDGA IYIADAALYL MAHKPDLGIK DPYELTEDQY KAALDLLRGQ RKLVSRYWHD 
AMIQIDDFKN EGVVASGSWP FQVNLLQADK QKIASTFPDE GVTGWADTTM LHVDSEHPNC 
AYMWMEHSLQ AKVQGDAAAW FGAVPSVPAA CKGNELMGDA GCATNGFDHF DKIKFWKTPV 
AKCTTQSECV PYHRWVSDYI GVIGGR