Gene Rleg2_1773 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_1773
Symbol
ID	6980510
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	1813811
End bp	1815076
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	62%
IMG OID	643396495
Product	extracellular solute-binding protein family 1
Protein accession	YP_002281285
Protein GI	209549368
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0165592
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACATA TCACCCAGCT TCTCGCCGCA GCGGCCGTAT CCTTGGCAAT CGCGCTTCCC 
GCGCATGCCG AGACGACGCT GACGGTTCAT TACCCGATGC CGGGTTTCTT CAAGGACGTG 
ATGGACACGA TCTCGAAGAA GTTCATGGCA GAAAACCCCG ACATCAAGAT CCAGTTCGCC 
AGCCCCTCGG CAACCTATGA AGAAGGCATC CAGACGATCC TTCGCCAGGT CGGCACCAGC 
GAAATGCCCG ACATCACCTT CATCGGCCTC AACCGCCTGC GCATGCTCGA CGAGCGCGAC 
GTCGCCGTCG ATCTCGGCCC GCTCGTCAAG AAAGACGGCA ACATGGCCGA GCAGGGCTTC 
TCCGACACGA TCTTGAAGCT CGCCCAGGTC AAGGGCAAGC AGGTGGGCCT CGCTTTCGCC 
ACCTCCAACC CGATCATGTA TTACAATGCC GATCTCGTGA AGGCGGCCGG CGGCGATCCT 
GAAAATCCGC CGAAGACCTG GGATGAGGTC ATTGCGCTCG GCGGCAAGAT CAAGGCGCTC 
GGCAACGGCG TCGACGGCAT CGATTTCCGC TGGCAGGGCG ATGACTGGAT GTTTTCCGCA 
CTGCTCTTCG GCGCCGGTGG CAGGATGCTG AGCGATGATG AGAGCAAGGT CGCCTTCAAT 
GGTCCAGAAG GCAAGAAGGC CGTCGAGGTC CTGCATCGTT TGGTCACCGA GGGCGGCATG 
CCGGTCTTCA CCAAGCCCGC CGGCGAACAG GCTTTCGCAG CCGGCAAGGT CGGTTTCGAA 
TTCCAGACGA CGGGCGCGCT GCGCAACACG ATCAAGAATG TCGGCGACAA GTTCGATCTG 
CGCACCGCCA AGATCCCGTT GATCGATCCG GTCAACGGCC GTCTTCCCAC CGGCGGCAAC 
GCCGTCGTCA TCCTGACGCA TGACGCCGCC AAGCAGGATG CTGCCTGGAA GTTCGCCAAA 
TTCGCAGCCG GCCCTTACGG CGCCTCCGTC GTCGTGCCCG GCACCGGTTA CGTCCCGAAC 
AACGAGCTTG CCGCCAAGTC GCCCGAATAT CTCGGCGATT TCTACAAGCA GAACCCGCTG 
TTCCAGGCCG GCCTCAGCCA GATGCCGGTG ATGATCCCCT GGTATGCCTT CCCCGGCTCG 
AACGGCGTCA AGGTCACCCA GACGATCGTC GACAACCTCT CGCGCATCGT CGACCAGTCG 
GCCGAGCCGA AGGAAGCGCT CGACGACGCG GCCGCCGATG TCGAGGGCAT GCTGCCGCGC 
AGCTGA

Protein sequence

MKHITQLLAA AAVSLAIALP AHAETTLTVH YPMPGFFKDV MDTISKKFMA ENPDIKIQFA 
SPSATYEEGI QTILRQVGTS EMPDITFIGL NRLRMLDERD VAVDLGPLVK KDGNMAEQGF 
SDTILKLAQV KGKQVGLAFA TSNPIMYYNA DLVKAAGGDP ENPPKTWDEV IALGGKIKAL 
GNGVDGIDFR WQGDDWMFSA LLFGAGGRML SDDESKVAFN GPEGKKAVEV LHRLVTEGGM 
PVFTKPAGEQ AFAAGKVGFE FQTTGALRNT IKNVGDKFDL RTAKIPLIDP VNGRLPTGGN 
AVVILTHDAA KQDAAWKFAK FAAGPYGASV VVPGTGYVPN NELAAKSPEY LGDFYKQNPL 
FQAGLSQMPV MIPWYAFPGS NGVKVTQTIV DNLSRIVDQS AEPKEALDDA AADVEGMLPR 
S