Gene Rleg2_6459 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_6459
Symbol
ID	6983530
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011371
Strand	+
Start bp	123089
End bp	124102
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	62%
IMG OID	643399456
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_002284212
Protein GI	209552297
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.0427942
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.0971645
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATCG AAAAATCCGG AAGCGGTCTT GGAAGACGAG ATCTGTTGAA ACTGTCCGCA 
GCCGCCGGGG TCGCCGTTGC CGGCGCTTCG CTGGTCGGGC AGAAGGCGGT TTTGGCAGCC 
GACGAAGAAC TGTCGCTGAA AGGCAAGCGC ATCGCCATCA GCGCAACCGG CACCGACCAT 
TTCTTCGACC TGCAGGCCTA TAATGCCCAG ATCGAAGAGG TAAAACGCCT CGGCGGCGAG 
CCGATCGCCG TCGATGCCGG GCGCAATGAC GGCAAGCTGG TGTCACAGCT GCAGACGCTG 
ATCGCCCAGA AGCCGGATGC AATCGTTCAA ATCCTCGGCA CGCTGAGCGT CATCGACCCC 
TGGCTGAAGA AGGCGCGTGA CGCCGGCATT CCGGTTCTGA CCGTCGACGT CGGCTCGACC 
AACTCGATCA ACAACACCAC CTCCGACAAC TGGGGCATCG GCAAGGACCT GGCGCTGCAG 
CTCGTCTCCG ATATCGGCGG CGAAGGCAAT ATCGTCGTCT TCAACGGTTT CTATGGCGTC 
ACCCCCTGCG CGATCCGCTA TGATCAGCTG GTCAATGTCG TCAAATATTT CCCGAAGGTG 
AAAATCCTTC AGCCGGAACT GCGCGACGTC ATCCCGAACA CCGTGCAGGA TGCCTTCACG 
CAGATCACCG CAATCCTCAA CAAATATCCC GAAAAAGGTT CGATCAAGGC GATCTGGTCG 
GCCTGGGATA TTCCGCAGCT TGGCGCCACC CAGGCTTTGG CGGCGGCCGG CCGGACCGAG 
ATCCGTACCT ACGGCGTCGA TGGCAGCCCC GAGGTTCTGC AGCTTGTCGC CGATCCGAAG 
TCGCCGGCCG GTGCCGACGT CGCGCAGCAG CCGGCGGAAA TCGGCCGCAC CGCCATCCGC 
AACGTCGCCA AGCTGCTCGC CGGCCAGACG CTGCCGCGCG AGACCTATGT TCCCGCCCTT 
CTCGCCAACA AGGCCAATGT CGGCGAAGTC ACCAAGAAGC TCGGTATCGG CTGA

Protein sequence

MSIEKSGSGL GRRDLLKLSA AAGVAVAGAS LVGQKAVLAA DEELSLKGKR IAISATGTDH 
FFDLQAYNAQ IEEVKRLGGE PIAVDAGRND GKLVSQLQTL IAQKPDAIVQ ILGTLSVIDP 
WLKKARDAGI PVLTVDVGST NSINNTTSDN WGIGKDLALQ LVSDIGGEGN IVVFNGFYGV 
TPCAIRYDQL VNVVKYFPKV KILQPELRDV IPNTVQDAFT QITAILNKYP EKGSIKAIWS 
AWDIPQLGAT QALAAAGRTE IRTYGVDGSP EVLQLVADPK SPAGADVAQQ PAEIGRTAIR 
NVAKLLAGQT LPRETYVPAL LANKANVGEV TKKLGIG