Gene Rleg2_3159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_3159
Symbol
ID	6981910
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	3242175
End bp	3243197
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	61%
IMG OID	643397875
Product	extracellular solute-binding protein family 1
Protein accession	YP_002282652
Protein GI	209550735
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAG CGCTCATTGC CTCGGCAGCA CTCGCCGCCC TGTCTCCGCT CGGAGCTACA 
GCAGCGGACC GCACATTGAC CATTTCGGTC TATGCTTTTG CCCAGGACGA TTTCAAGACG 
CTGGTCTATG ATCCCTTCGA AGCCAAATGC GGCTGCAAGC TGGTGGTCGA GACCGGCAAC 
AGCGTCGAAC GCCTGGCCAA GATGGAAGCG AACAAGGCGA ACCCCGTCGT CGACCTCGCC 
GCTGTTTCCA TGGCCGATGC GCTGGCCGCC TCCCGTGCCG GCCTGATCGA CAAGGTCGAC 
ACCACCAAGC TCGCCAATTT CACCAAGCTC TACGACGTCG CCAAGGATCC GAACGGCGAC 
GGCATGAGCG TCGGTTACAC CTTCTACGCC ACCTCGATCG CCTATCGCTC CGACAAGATG 
AAGATCGACT CCTGGGCCGA TCTCCTGAAG CCGGAATATG TCGGCCACGT CGCCTTCCCG 
AACGTGACGA CCAACCAGGG GCCGCCGGCG CTCTATATGC TGGGCCAGGC GCTCGGCAAG 
GACACCCCCG ATCTGAAGGG GCCGATCGAG GCGCTGGGCG AGAAGAAGGA CGACATCGTC 
ACCTTCTACG AAAAATCCTC GCAGCTCGTG CAACTGATGC AGCAGGAGGA AATCTGGGCC 
GCGCCGATCG GCCGTTTCTC CTGGGCTGGT TTTACCAAGC TCGATGTTCC GGTCGCCTGG 
GCGACACCGA AAGAGGGTCA GACCGGCGGC ATGAATGTGC TGGTGCTGAC CAAGGGTTCG 
AAGAACCAGG ATCTCGCCCT GCAGTTCATG GATTTCTGGC TCTCGACCGA CATCCAGACC 
AAACTCGCCG AAAAGCTGGT CGACAGCCCG GCCAACAGCG AGGTCAAGCT TTCCGAAGCC 
GCTGCCAACA ACCTCACCTA TGGCGAGGAA ACCGCCAAGA GCCTCAAGCT GATCCCTTCG 
GCCGTCGCCC TCGACAATCG CGCCGGCTGG CTGAAGACCT GGAACGAAAA GGTCGGCCAG 
TAA

Protein sequence

MKKALIASAA LAALSPLGAT AADRTLTISV YAFAQDDFKT LVYDPFEAKC GCKLVVETGN 
SVERLAKMEA NKANPVVDLA AVSMADALAA SRAGLIDKVD TTKLANFTKL YDVAKDPNGD 
GMSVGYTFYA TSIAYRSDKM KIDSWADLLK PEYVGHVAFP NVTTNQGPPA LYMLGQALGK 
DTPDLKGPIE ALGEKKDDIV TFYEKSSQLV QLMQQEEIWA APIGRFSWAG FTKLDVPVAW 
ATPKEGQTGG MNVLVLTKGS KNQDLALQFM DFWLSTDIQT KLAEKLVDSP ANSEVKLSEA 
AANNLTYGEE TAKSLKLIPS AVALDNRAGW LKTWNEKVGQ