Gene Rleg_4940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4940
Symbol
ID	8007533
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	+
Start bp	318427
End bp	319881
Gene Length	1455 bp
Protein Length	484 aa
Translation table	11
GC content	56%
IMG OID	644821857
Product	extracellular solute-binding protein family 1
Protein accession	YP_002973117
Protein GI	241113282
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAATCG ATATCGGAAA TATGTCGCGA CGTGACCTGC TGAAAAGCGC TTCCGTCGCA 
GCTCTTGTGG CTGGCGCGGG ATCACTGGCC ATTCCACGGC GAGGAGCCGC GCAGGATGCG 
AACACGGTTC GCGTCCTGTC CGTTGAAGAC CCATTCTTCT TCTCAATGAA GGAGTTGGTG 
CCGGAATACG AGAAAGAAAC CGGTATCAAG GTCGAACTGG AGAGTCTCTC CTATGACGCC 
CTTCAATCGC GCCTCGTGTC TGCCTTTGTC GCCAAGACCT CAGACGCCGA CGTCATCGTT 
GTCGATCAGA TGTGGCTCGG GCAGTACCTC GACAATGGCT GGATCATCTC GCTGAACGAT 
TTTATTGCCA AGGACAGCGA ATTCGACCTC TCAGACTTCA TCCCGGAGGT CCTTTACTCC 
TCGAACATGT GGCGCGGCCA GATCGGGACA TTGCCGGTCG CCGCCTATGC CCAAGGGGTT 
ATGTACCGCA AGGACGTGTT TGACAAACTC GCCATTGAAG CGCCGCCGAC CAAGACCTCG 
GAAGACTGGA CCTGGACCAA ATATGTCGAC ACACTGAAGT TGATGGAAGG CAAGTCATTT 
GGCGGCAAAC CGTTGTTTCC CACGGTTGTC TGCGGCTCCC AACCGTCGCC GATCGTCCAC 
ATGTTTACGC AGGTGTCGGC AAGCCACGGT GCCAACTGGT TCAAATCATT CCCTGCCGAC 
CCGTGGGATT TCTCTCCGCA GTTGACAAGC CCCGCCTGGG TCAAATCTGT TGAAGTCTAT 
AGGCAGCTCT ACAAGCTGTC TCCGCCTGAA GCGATCAACT ATGTCTGGTT CGACGCCGGC 
ACCCGTTTTG CCAAAGGTGA CATCGGGATG TTCTACTGGT GGACGCCGTA CTTCTACCTG 
ATCAAAAACT CGGGCTACAT GACCGGCAAG AAGTCGGACG TGATGGACAA GTACGCGACG 
GCGGCCTTGC CAAAGGCTGA GGGCGTGCCT CAGACGGTCA GTCTCGGCGG ATGGAGCCTT 
GGCATCCCAT CCAGTTCCGA AAGGCAAGAA GCAGGCTACG CCTTCATCAA ATGGGCGACC 
TCGAAAACCA CGCAGAAGAA AATGGCTCTT TGGCCGGACC TTAACTACCA ATTCTCCGAC 
TTTGCGCGCG TTTCACTCTA CGAAGACGAG GAAGTCAAAG CGCTCTACCC GTACCTCGAT 
GTGCAGTATG CGATGATGAA GCAGGGTAAC GGCAAGGTCA CACGCCCGCC TGTACCTGGT 
TACACGGCCA TTGAAAGCGT GCTGGGCCTC ACATTGAACC AGCTTTTGAC CGGTAGCGAA 
GAGCCGAAGA CCGGCCTTGA ACGTGCCAAC AGCCTGTTCG AGAGCATCCT GAAGGGTAAT 
CTCATGATCC CTTATCAAAA AGCCAGCTAC GCAGACACTC TTGACGGGGC CAAAGCCCAG 
ATCGCCAAGA GGTAA

Protein sequence

MTIDIGNMSR RDLLKSASVA ALVAGAGSLA IPRRGAAQDA NTVRVLSVED PFFFSMKELV 
PEYEKETGIK VELESLSYDA LQSRLVSAFV AKTSDADVIV VDQMWLGQYL DNGWIISLND 
FIAKDSEFDL SDFIPEVLYS SNMWRGQIGT LPVAAYAQGV MYRKDVFDKL AIEAPPTKTS 
EDWTWTKYVD TLKLMEGKSF GGKPLFPTVV CGSQPSPIVH MFTQVSASHG ANWFKSFPAD 
PWDFSPQLTS PAWVKSVEVY RQLYKLSPPE AINYVWFDAG TRFAKGDIGM FYWWTPYFYL 
IKNSGYMTGK KSDVMDKYAT AALPKAEGVP QTVSLGGWSL GIPSSSERQE AGYAFIKWAT 
SKTTQKKMAL WPDLNYQFSD FARVSLYEDE EVKALYPYLD VQYAMMKQGN GKVTRPPVPG 
YTAIESVLGL TLNQLLTGSE EPKTGLERAN SLFESILKGN LMIPYQKASY ADTLDGAKAQ 
IAKR