Gene Rleg2_4849 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_4849
Symbol
ID	6977943
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	+
Start bp	491365
End bp	492318
Gene Length	954 bp
Protein Length	317 aa
Translation table	11
GC content	64%
IMG OID	643394010
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_002278828
Protein GI	209546910
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID	[TIGR01168] Gram-positive signal peptide, YSIRK family

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0999053
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0394517
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATCCA TTCTGAAGAA GCTTGCATAC GGTGTTGTCG CCGTTGGAAT CGCAGCGTCG 
TGGTCGGTTG GCGTGAAGGC GCAGGAGCAG CCGAGCATCA TCGCCGTCAC GCACGGGCAG 
GCGTCGGATC CATTCTGGTC GATCGTCAAG AACGGCATGA TGCAGGCCGC CAAGGACAGC 
AACGTGAAGG TCGACTACCG CGCGCCGGAA ACCTTCGACA TGGTCGCAAT GGCTCAGCTC 
ATCGAAGCCG CCGTCAATCA GAACCCGGCC GGCATCGTCA TCTCCAATCC TGATCCTGAC 
GCGCTGGGCC CGGCTATCGA AAAGGCGGTC GCCGCCGGCA TTCCGGTTAT CTCGATGAAC 
TCGGGCATTT CAGCCGCCGA GAAGCTCGGC ATCAAGCTGC ATGTCGGCCA GGACGAGATG 
CCGGCCGGCA TCAAGGTCGG CGAGAAGCTC AAGTCGCTGG GCCTGAAGCA TGTCCTCTGC 
GTCAACCAGG AAGTCGGCAA CGCCGCGCTC GACCAGCGTT GTGCCGGCAC CGAGAAGGGC 
TTCGAAGGGG GCAAGGTCAC TGTCCTGCCG ACCACGGCGG ACCCGGCGGA AATCGAAGCG 
AAGATTCAGG CGGCGCTGAC CTCCGATCCG TCGATCGACG TCGTGCTCGG CCTCTCGGCT 
CCGCTCGTCG GCGAGCGCGC CGTCGCGGTT GTCGAAAAGA TGGGCAACGG CGACAAGGTC 
AAGGTGGCAT CCTATGATCT ATCCGCCGGC TTCCTGCAGG CCGTTGCGGA CGGCAAGGCC 
CTCTTCGCCG TCGATCAGCA GCCCTACCTG CAGGGCTATC TGCCCGTGAC CTTCCTCGCT 
CTCAACGCCC GCTACGGCAC GATCCCGGCA GGCAACGTCG CCTCCGGCCC GAGCTTCGTC 
GAGAAGGACG CAGCCGCTTC GGTCATCGAG AAATCCTCCC AGGGCATCCG CTAG

Protein sequence

MKSILKKLAY GVVAVGIAAS WSVGVKAQEQ PSIIAVTHGQ ASDPFWSIVK NGMMQAAKDS 
NVKVDYRAPE TFDMVAMAQL IEAAVNQNPA GIVISNPDPD ALGPAIEKAV AAGIPVISMN 
SGISAAEKLG IKLHVGQDEM PAGIKVGEKL KSLGLKHVLC VNQEVGNAAL DQRCAGTEKG 
FEGGKVTVLP TTADPAEIEA KIQAALTSDP SIDVVLGLSA PLVGERAVAV VEKMGNGDKV 
KVASYDLSAG FLQAVADGKA LFAVDQQPYL QGYLPVTFLA LNARYGTIPA GNVASGPSFV 
EKDAAASVIE KSSQGIR