Gene Rleg_0407 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_0407
Symbol
ID	8011610
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	420287
End bp	421384
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	59%
IMG OID	644823002
Product	extracellular solute-binding protein family 1
Protein accession	YP_002974257
Protein GI	241203161
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000000173672
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAGGTCAA CCATCCTATG CGTGACGGCC GCCGCTGTTA CCGCACTCCT TGCTGCCGCG 
CCGGCCCTTG CGCAGGAGCG CGTGGTCAAC GTCTACAACT GGTCGGATTA TATCGACAGT 
TCCATCCTCG AGGATTTCAC CAAGGAAACC GGCATCAAGG TCGTCTACGA CACTTTTGAT 
TCCAACGAGA CGCTGGAAAC CAAGCTCTTG GCTGGTGGTT CGGGGTACGA CGTGGTCGTC 
CCCACGGTAT CCTTCATGAA GCGCCAGATC GCCGCCGGCG TCTACCAGAA GCTCGACAAG 
TCGAAGCTGC CGAACCTGGT CAACATGTGG GACGTCATCA TGAAGGGCGT GGCGTCCTTC 
GACCCCGGTA ACGAATACAG CGTCGACTAC ATGTGGGGCA CGACGGGCAT CGGCTACAAT 
GTCGACAAGG TCAAGGCTGC CCTCGGAACC GACGAAAAGC CCAATTGGGA CGCGCTGTTC 
GACCCGGCGA AAGCAGCAAA GCTCAAGGAT TGCGGCATCT ACATGCTGGA TTCCCCCACC 
GACGTGGTGC CCTCGGTGCT CGCCTATCTC GGGCTCAATC CGAACAGTAC CGACGCTGCC 
GACCTCAAGA AGGCGCAGGC GGTCCTCACG GCCGTTCGTC CCTTCGTCCG CAAGTTCCAT 
TCGTCCGAAT ATATCAGCGC GCTGGCGAAC GGCGATATCT GCATCGCGCT CGGTTATTCC 
GGCGATATGT TCCAGGCCCG TGACCGTGCT AAGGAAGCCA ATGTCGGCGT GAAGGTCGAT 
TATTCGGTCC CGTCGCAGGG CGCCCAGATC TTCTTTGACG TCTTCGGCAT TCCGAAGGAT 
GCGCCGCATG TCGCCGAAGC CCATGAATTC ATCAACTACA TGATGAAGCC CGAAGTCGTC 
GCCAAGGCAT CCAACGTCGT CTTCTATGCC AACGGCAACA AGGCGTCGCA GCAGTTCCTC 
GACAAGGAAG TCCTCGACGA CACGGCGATC TACCCAACGC CCGAAGTCAT GGCGAAACTC 
TTCACCGTTC CGCCGCTCGA TCCGAAGGCG CAGCGGCTCG TGACGCGGCT ATGGACCACC 
GTGGTCACCG GCCAATGA

Protein sequence

MRSTILCVTA AAVTALLAAA PALAQERVVN VYNWSDYIDS SILEDFTKET GIKVVYDTFD 
SNETLETKLL AGGSGYDVVV PTVSFMKRQI AAGVYQKLDK SKLPNLVNMW DVIMKGVASF 
DPGNEYSVDY MWGTTGIGYN VDKVKAALGT DEKPNWDALF DPAKAAKLKD CGIYMLDSPT 
DVVPSVLAYL GLNPNSTDAA DLKKAQAVLT AVRPFVRKFH SSEYISALAN GDICIALGYS 
GDMFQARDRA KEANVGVKVD YSVPSQGAQI FFDVFGIPKD APHVAEAHEF INYMMKPEVV 
AKASNVVFYA NGNKASQQFL DKEVLDDTAI YPTPEVMAKL FTVPPLDPKA QRLVTRLWTT 
VVTGQ