Gene Rleg2_5223 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_5223
Symbol
ID	6978317
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	-
Start bp	854809
End bp	855699
Gene Length	891 bp
Protein Length	296 aa
Translation table	11
GC content	62%
IMG OID	643394337
Product	extracellular solute-binding protein family 3
Protein accession	YP_002279155
Protein GI	209547237
COG category	[E] Amino acid transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG0834] ABC-type amino acid transport/signal transduction systems, periplasmic component/domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.170331
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATTAA AGAAAATCAC CACTGTTGCG CTCGCCGGCG TCATGCTCTC CGGCGCAGCC 
TTCGCCGAAG ACGCAAGCCT GCCGAAACTC TCGGTCAACG AGGAGCTGAA GGCCAAGTTG 
CCGGAGGCGA TCCGCACCGC CGGCAAGATG ATTTCCGTCA ACAACGGTTC CTTCCCTCCC 
TATGAGATCG TCACCGGCAC CGAGATGACC GGTGCCAGCG CCGACCTGAC CGACGCGCTC 
GGACAGGTGC TTGGCGTCAC GATCGAGCAT CAGACGGTCG GCGGCCTGCC CGCCCTCCTC 
GCCGGCGTCA ATTCCGGCCG CTACCAGTTC GCCTTCGGCC CCGTCGGCGA CTTCAAGAGC 
CGCGAAGAGG CCAACGACTT CGTCGACTGG GTCCAGGAAT TCGTGGTTTT CGCGGTCCAA 
AAGAGCAATC CGAAAGCGAT CACCTCACTC GACACCGCCT GCGGCAACCG TATCGCCGTG 
ATGGCCGGCG GCTCGGCGGA AAAGGTCATC CAGGTCCAGG CCGAGAAGTG CAAGACCGAT 
GGCAAGGATC CGATCGAAGT CCAGTCCTTC ACCGATCAAC CGAGCTCAAT CCTCGCTGTT 
CGATCGAAGC GTTCGGACGC CTTCTTCTCC TCCCAGGCGC CGCTCACCTA TTTCGTGTCG 
CAGTCCAATG GCCAGCTGGA GCTCACCGGT GTCGGTCAGA AGAACGGCTT CGAAGCGCTC 
TACCAGGGCG CCGTCGTTCC GAAAGGCTCG CCGCTCGGCC CGGTGCTCCG TGACGCGGTC 
AAGTTTCTGA TGGATAATGG CACCTATGCC GCCATCATGA AGAAGTGGGG CCTCGAGAAC 
AACATGATCA AGGAGCCGGG CATCAACCTC GGCGGGACGT TGCCGAAATG A

Protein sequence

MQLKKITTVA LAGVMLSGAA FAEDASLPKL SVNEELKAKL PEAIRTAGKM ISVNNGSFPP 
YEIVTGTEMT GASADLTDAL GQVLGVTIEH QTVGGLPALL AGVNSGRYQF AFGPVGDFKS 
REEANDFVDW VQEFVVFAVQ KSNPKAITSL DTACGNRIAV MAGGSAEKVI QVQAEKCKTD 
GKDPIEVQSF TDQPSSILAV RSKRSDAFFS SQAPLTYFVS QSNGQLELTG VGQKNGFEAL 
YQGAVVPKGS PLGPVLRDAV KFLMDNGTYA AIMKKWGLEN NMIKEPGINL GGTLPK