Gene Rleg2_6090 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_6090
Symbol
ID	6983163
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011370
Strand	+
Start bp	15671
End bp	16948
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	58%
IMG OID	643399116
Product	extracellular solute-binding protein family 1
Protein accession	YP_002283872
Protein GI	209551956
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAAACC TATATCATAA CGTGCCTCGC AGGTCGGTCC TGAAGGGCGG CTTTGGTCTT 
GCAGTCGGGC TCGGCGTCAC ACTAAAGGCA CCGGCGATGC TGGCTCAGGA CAAAAGCCTT 
TCGCTGATGG TGCTCGGTCC GGACCAGAAG GCGACTGCGT GGCTGAAGAT CGCGCTGGAG 
GAGTTCAAGG CAAAGACGGG ATATGAGGTC GAGTTGCGGC AGTCCGACTG GGGCTCGGCT 
TTCCAGAAGC TTCTGACTGC AACTGCCAGC GGTACGCTCG CCGATGTCTG CATGATGGGC 
CAGGTGATGA CCCCTGCCCT CGCCTCCAAA GGAGCCTTCC TGCCGATCGA TTCCTATCTC 
AAGGGCTGGG TGGACGCCGA ACAGTTCTAC GCGCCGATGC TGAAGGACGG CATTTTCGAC 
GGCAAGTCCT ACGCTTTGCC GATCTATGCC GACGTGCGGA CTTCAATCTA CCGCTCCGAC 
ATTCTCAAGA AGGCGGGCGT CGAGACTTTG CCGACGAACT GGGATGAGTT CAAGGCCTTG 
GCCAAGAAAC TATCGACCAA GAATGGTGGT CCACTTGATG CGCCGTTCTT TGCCAATCAA 
GACAAGTCGG TTGGCCTTAT GCAGACTTTC TCCCAGTTCC TGGTGCAGGC CGGCGGCAGC 
TATTTCGATG AAAAGGGCAA GTCGATCCTT TCGGCCGAGC CCGGCCAAAA GGCGCTGAAC 
TATCTCGTCT CGTTTTTTGC TGAAGGACTG GCAAATCCGA ATGTCGTCTA TCAGGGAACA 
GGTCCGACTC CACTCGTGCA GGGACAAGCG GCGATGACGC TCAACAGCGT CTTCGAGCCG 
CGCAATGCGC ATGCCAACAA TCCCGAAGTC GAGAAATTCG TCATTGCCGG CGCGCCGTTA 
TCCGCCACTC CAGGCGGCAA GCCGGCCACG CTCGCCTGGA TCAACAAGCT CGGCATTGGC 
GCCAACACGA AAGATCCGGA CGGCGCCTGG CAGCTGCTAT CCTATCTCGT GTCGAAATCT 
TCGTCCGAAA AGTTCGCGGA ACTTTGGGGC GGCCTGCCCG CCCGCCAGGA TTTGAAGGAC 
GCGCCCTTCC TTGCCAATGT CGACAAGGGC TTTGTTGACG CGACCCAATA TGCCGGCGCT 
CTGCCGACCA CACCGAGCCT TCTGCAGATC CAGAAGGAGG TCAACATCGC AATGCAGTCG 
GCGATACGCC AGGCTCAGCC ACCGGCTGAG ATCCTTTCCG CGCTCGACAC GAAGATCGAC 
GAAATCACTG GTTCCTGA

Protein sequence

MTNLYHNVPR RSVLKGGFGL AVGLGVTLKA PAMLAQDKSL SLMVLGPDQK ATAWLKIALE 
EFKAKTGYEV ELRQSDWGSA FQKLLTATAS GTLADVCMMG QVMTPALASK GAFLPIDSYL 
KGWVDAEQFY APMLKDGIFD GKSYALPIYA DVRTSIYRSD ILKKAGVETL PTNWDEFKAL 
AKKLSTKNGG PLDAPFFANQ DKSVGLMQTF SQFLVQAGGS YFDEKGKSIL SAEPGQKALN 
YLVSFFAEGL ANPNVVYQGT GPTPLVQGQA AMTLNSVFEP RNAHANNPEV EKFVIAGAPL 
SATPGGKPAT LAWINKLGIG ANTKDPDGAW QLLSYLVSKS SSEKFAELWG GLPARQDLKD 
APFLANVDKG FVDATQYAGA LPTTPSLLQI QKEVNIAMQS AIRQAQPPAE ILSALDTKID 
EITGS