Gene Rleg2_4984 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_4984
Symbol
ID	6978078
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	+
Start bp	628377
End bp	629663
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	57%
IMG OID	643394130
Product	extracellular solute-binding protein family 1
Protein accession	YP_002278948
Protein GI	209547030
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAGA AGCTTTTCGT CGGCGCAAGC GTGCTCGCTC TCTTGATGTC AGCGGCATCA 
ACCTGGGCGG CGGACAAGGA AATCACGGTG TGGTCCTGGT TCGTCCAGAG CACTATGCAA 
AAGTCCATTG ATGCTTTCCA AAAAGCGCAT CCGGACGTCA AGGTGACGTA CACCTATTAC 
AACTTCTCGC CGGAATACAT CACCGCGCTG AAAGCTGCGG CCGCATCTGG CAGCCTTCCC 
GACGTGATTG GCTTGCAGCC CGGCTCACTT GCCCAGCAGT ACCGAGAACA GCTCGAACCG 
ATCAATGACC GTGCCACCAA ACAGTGGGGC GCGGATTGGG AAAAGAACAT CTTCCCAGTC 
AATCGCAAGC AGATGCAGAT GGGTAACCCA AAGGGCGACA CCAACTATTA CCTGATGCCG 
CAGGAGTCAC AGGTTCTCTG CATTTGGTAT AATCGAAAGC TCTTCGAGGA GCTCGGCATT 
GCGGTCCCGA AAACCTACGA CGATCTGAAG GCTGCATCTA AGAAGCTCAC TGAAGGCGGC 
TTCATCCCAA TGTTCCAGGG TGCTGCCGAC GGCTGGCAGA ATGAGAATGT CTTCCTGATG 
CTTGCCAACC AGTTCTCTCC GGGTATCGTC GATAAGGCGC AAGCAGGCGA AACGCCTTGG 
ACAGCGCCGG AACTCGTAGA AGCGATGCAG GCTTGGAAGG GTCTGTTCGA TGACGGAGTG 
TTCCAGCAGG GTGCTCTAGG TGCCCATGCG TATCCGACAG GCGCACAGCT GTTCCAGCAG 
GGTAGGGTCG GCATGATGGC GCTCGGATCG TGGTGGATGC AGGAAAGCAA ATTCCCGCCA 
CCGCTTTCGG AGTTCGTCCA TAACATGGAA GGTTTCGACT TCTTCTATAT GCCGCCAGTG 
AAGGATGGCA ACAAAGCCAG CCCGCCAGTC GGTGGCATCG ATATTGGCTA CGGTCTCACC 
AAAAACGACG CAAAGAACGA GGAGGCCTGG ACATTCCTCG CCGAACTCAC CAATGGCGTC 
GGTCTTCAAG AAGCCCTTAA CGATCTCAAT GACCTTCCGG CATTTTCGGG ACACGAGCCC 
AAGGGCGACA TTACCGACCA CGTCAAGGAA ATGTCCGCTC GCTTTATGGC CGACCTCCCC 
AAAGCCGAAA ACCAGCGCTT CGCTTCGCCT GCCGTCGCCG AGGCGCTCGA CAATGCTCTG 
GCCGGGGTCG CGGCGGGAAG CCTGGAACCC AAGGCGGCCC TGAAGTCCGT CGACGAAGCG 
ACGCAGAAAG CGCTGGCCTC GAAGTAA

Protein sequence

MKKKLFVGAS VLALLMSAAS TWAADKEITV WSWFVQSTMQ KSIDAFQKAH PDVKVTYTYY 
NFSPEYITAL KAAAASGSLP DVIGLQPGSL AQQYREQLEP INDRATKQWG ADWEKNIFPV 
NRKQMQMGNP KGDTNYYLMP QESQVLCIWY NRKLFEELGI AVPKTYDDLK AASKKLTEGG 
FIPMFQGAAD GWQNENVFLM LANQFSPGIV DKAQAGETPW TAPELVEAMQ AWKGLFDDGV 
FQQGALGAHA YPTGAQLFQQ GRVGMMALGS WWMQESKFPP PLSEFVHNME GFDFFYMPPV 
KDGNKASPPV GGIDIGYGLT KNDAKNEEAW TFLAELTNGV GLQEALNDLN DLPAFSGHEP 
KGDITDHVKE MSARFMADLP KAENQRFASP AVAEALDNAL AGVAAGSLEP KAALKSVDEA 
TQKALASK