Gene Rleg2_5331 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_5331
Symbol
ID	6978425
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	-
Start bp	956041
End bp	957315
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	60%
IMG OID	643394433
Product	extracellular solute-binding protein family 1
Protein accession	YP_002279251
Protein GI	209547333
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATTTGG AAAAATTCGG GAGGACGGTG AAACTTGCCG TGGCAGGTTT TACCTTGGCA 
GCAACGACAT CAGGCGCAGC GTTTGCCCAA GACGCCGTGA CGCTCAAATG GGCTTTGTGG 
GACTGGGATA AGACCGCCTA TTACAAGCCG CTGATCGAGG CCTATCAGGC CAAGCATCCG 
AACGTGAAGT TCGAGCCGAT GGATCTCGGC TCGCAGGACT ACCAGCAGAT GATTTCGACG 
CAGCTGACCG GCGGCTCGAA AGACATCGAC ATCGTCACCA TCAAAGACGT GCCGGGCTAT 
ACCAATCTGG TGCGCGCCGG CAATATCGCC GATCTGAGCG GCTTCGTGAA GGATCAGAAA 
ATCGATCCGG CCCCCTATGG CGGCTTGATC GAGGAATTGA CCATCGACGG CAAGGTCTAT 
TCTCTGCCGT TCCGCTCCGA CTTCTGGATC GTCTATTACA ACAAGGACAT CTTCGACAAG 
GCTGGCGTCC CCTACCCCAC CAATGACATG ACCTGGGCGC AGTTCGACGC GACCGCCGAG 
AAGCTGACCG GCGGCATGGG CACCAACAAG ACCTATGGCG CGCTGCTGCA CACCTGGCGT 
TCGACCGTCC AGCTGCCTGG TATCCTCGAC GGACAACACA CGCTGGTCGA CGGCGACTAC 
GCCTTCCTGA AGCCGTGGTA CGAGCGGGCG CTCACCCTGC AGAAGGATGG CGCAATTCCC 
TCCTATGCCT TCCTGAAGAC GTCGAACACG CATTATTCGG CGCTGTTCTT CAACGGCACG 
ATCGGCATGC TGCCGATGGG AACCTGGTTC GTCGGCACCC AGATCGCCAA GGTGAAATCG 
GGTGAATCGA AGAGCAAGAA CTGGGGCATC GTGAAGTTCC CGCATCCGGA CGGCGTGGCA 
GCCGGCACGA CGGCTGCGCA GATCTCGGGC CTCGCCGTCA ACGCCAACTC AGAGCACAAG 
GATGCGGCCC TCGACTTCAT CAAGTTCGTC ACCGGTCCGG AGGGCGCTGC CGTCATCGCA 
TCGACGGGCA CCTTCCCGGC GCTCAAGACC GCCGATGTCA GCGCAAAGAT CGCCGCAACG 
CCCGGCTTCC CGGAAGACGC GGCCAGCAAG GAGGCGCTGA TACCGTCGAA GGCCTATCTG 
GAGATGGCGG TCAACCCGAA CGCGGCCAAG ATCGAGGTCG TGCTCAACCG CGTCCATGAC 
GCGATCATGA CCGACAATAC CCCGATCGAC GACGGCCTGA AGGAAATGAC CGAAGGCGTC 
AAGGCCATCA AGTAG

Protein sequence

MYLEKFGRTV KLAVAGFTLA ATTSGAAFAQ DAVTLKWALW DWDKTAYYKP LIEAYQAKHP 
NVKFEPMDLG SQDYQQMIST QLTGGSKDID IVTIKDVPGY TNLVRAGNIA DLSGFVKDQK 
IDPAPYGGLI EELTIDGKVY SLPFRSDFWI VYYNKDIFDK AGVPYPTNDM TWAQFDATAE 
KLTGGMGTNK TYGALLHTWR STVQLPGILD GQHTLVDGDY AFLKPWYERA LTLQKDGAIP 
SYAFLKTSNT HYSALFFNGT IGMLPMGTWF VGTQIAKVKS GESKSKNWGI VKFPHPDGVA 
AGTTAAQISG LAVNANSEHK DAALDFIKFV TGPEGAAVIA STGTFPALKT ADVSAKIAAT 
PGFPEDAASK EALIPSKAYL EMAVNPNAAK IEVVLNRVHD AIMTDNTPID DGLKEMTEGV 
KAIK