Gene Rleg2_4758 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_4758
Symbol
ID	6977852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	+
Start bp	390207
End bp	391460
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	59%
IMG OID	643393925
Product	extracellular solute-binding protein family 1
Protein accession	YP_002278743
Protein GI	209546825
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTAAAA AATTCTTATC ACTGCTTGCC TCCGCCGCAC TGGCTGTCGC ACTTCCTGCC 
GCCGCCCAAG ACAAGCCGCT CGCCGGCAAG TCGATCACCG TATTGATGCC ATCCCCGCAG 
GGGCCGGACA TCGCGTCCGC GTTTGAAGCC GAGACCGGCA TTCATGTCGA TCTCCAGACA 
CTTTCCTGGG ACGACATCCG CCCGAAGTTG GTGACGGCGC TTGTCGCCGG CACCGCGCCT 
GCTGACGTAA CCGAATTCGA CTGGTCCTGG ACCGGTCAGT TCGCGGCGGC AGACTGGTAT 
ATGCCGCTGA ACGATTCTTT CGATGCGGAT ACACTCAAGG ACATCAGCGT TGCCAAGATC 
TTCACCGTCG ATGGCAAGCT GCTGGGCATA CCCTACACCA ACGACTTTCG GGTGATGCTC 
GTTAACAAGA AGCACTTCGC CGATGCCGGC ATAACCGAGA TGCCGAAGAC ACTTGAACAG 
CTTGAAGCTG CCGCAAAGCA GATTAAGGAG AAAGGCGTCG CCACCTATCC GATCGGTCTG 
CCGCTGTCGG CCACGGAAGG GGCTTCCACA AGCTGGTATC TCCTGACCAA GGCATTCGGA 
GGCGAGCTGT TCGACAAGGA CTTCAACCCA CTCTTCACCA AGCCCGATTC CGCCGGCTAC 
AAGGCGCTCG CCTTCGAACT GAAGCTGCTC AAGGAAGGTC TTGTTGATCC CGCGTCGACC 
GGCCTCAAGG ACAGCCAGAT CAACGAAGGC ATGTTCTCCC AGGGCCTGAC GAGCATCATG 
ATTTCGGGCG AACCGGGCCG TCTCGGTCAG ATGAACGATC CCAAACAGTC AAAGGTTGCC 
GGCCAGGTCG AGGCGATCCT GGTTCCGACC GAAAGCGGCC AGACGCGCAG CTTCGGTCTA 
CCGGAGGCCC TGGCGATTCC GAACGTCTCG TCCAACAAGG AAGCGGCCGT CGCCTTTGTC 
AAATGGTTTA CGAGCCGCGA GTTCCAGAAG AAGAACGTCG CCAATGGCTT CCTTCCGACC 
AGGACATCCG CCTTGTCTGA ACTAAATTCG GAAGGAAAGC TGAACAGCGG CGATGCGCTC 
GTGGCGCAGT CGAAGACCGT TGAAGCGCTC TTTCCGCAGG GCACGCCCCC ATGGTACCCA 
CAATTCTCGA GCGGCGTGAA CACCGCGATT AACAGCGCTG CCAAGGATCA GATGACGGTT 
GACCAGGCGG TCGAGAGCAT TGCCTCTGCA GCAAAGCAGG CGATGGCACA ATGA

Protein sequence

MRKKFLSLLA SAALAVALPA AAQDKPLAGK SITVLMPSPQ GPDIASAFEA ETGIHVDLQT 
LSWDDIRPKL VTALVAGTAP ADVTEFDWSW TGQFAAADWY MPLNDSFDAD TLKDISVAKI 
FTVDGKLLGI PYTNDFRVML VNKKHFADAG ITEMPKTLEQ LEAAAKQIKE KGVATYPIGL 
PLSATEGAST SWYLLTKAFG GELFDKDFNP LFTKPDSAGY KALAFELKLL KEGLVDPAST 
GLKDSQINEG MFSQGLTSIM ISGEPGRLGQ MNDPKQSKVA GQVEAILVPT ESGQTRSFGL 
PEALAIPNVS SNKEAAVAFV KWFTSREFQK KNVANGFLPT RTSALSELNS EGKLNSGDAL 
VAQSKTVEAL FPQGTPPWYP QFSSGVNTAI NSAAKDQMTV DQAVESIASA AKQAMAQ