Gene Rleg_0157 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_0157
Symbol
ID	8015405
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	154908
End bp	155897
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	62%
IMG OID	644822748
Product	sugar ABC transporter, substrate-binding protein
Protein accession	YP_002974007
Protein GI	241202911
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.000000969227
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTTCG TGAAATCCCT TCTGTCCCGC CGCGCCTTTA CCGCGCTTGC GGGCGCCGCA 
GTTATCGCCT CGGCGATGCC GGCACCGTCG TTTGCGGCCG ACGTGACGAT CCCGATCATC 
GTCAAGGACA CGACGTCCTT CTACTGGCAG ATCGTTCTGG CCGGCGCCCG CAAGGCCGGC 
AAGGATCTCG GCGTCAACGT GCCGGAACTC GGCGCTCAGG CCGAATCCGA CGTCAACGGC 
CAGATCAGCA TTCTTGAGAA CGCCGTTGCC GGCAAGCCGG CGGCCGTCGT CATTTCGCCG 
ACCGAATTCA AGGCGCTCGG CAAGCCGATC GATGAAGCGG CCAAGTCGGT TCCGATCATC 
GGCATCGACT CGGGCGCCGA CTCCAAGGCG TTCAAGTCGT TCCTGACGAC CGACAACGTT 
CAGGGCGGCC GCATCGCCGC TGACGGTCTG GCCGCCGCCA TCAAGGGCGC CACCGGCAAG 
GAAGAGGGCG AAATCGTCAT CCTCACCAAC CTTCCGGGCG TCGGCTCGCT GGAACAGCGC 
CGCGAAGGCT TCCTGGATCA GGTGAAGACC AAGTATCCCG GCCTGAAGGT CATTGCCGAC 
AAGTACGGCG ACGGCCAGGC AACGACCGGC CTCAACATGA TGACCGACCT GATCACGGCA 
AATCCGAACC TCGTCGGCAT CTTCGCCTCG AACCTGATCA TGGCGCAGGG CGTTGGCCAG 
GCGATCGCCG AAAACAAGCT CGGCGAGAAG ATCAAGGTCA TCGGCTTTGA CAGCGACGAC 
AAGACGGTCG GCTTCCTCAA GGATGGTGCG ATTGCCGGCC TCGTCGTTCA GGACCCCTAC 
CGCATGGGTT ATGACGGCGT GAAGACCGCG CTTGCCGTCT CCAAGGGCGA GAAGGTCGAA 
GAGAATGTCG ACACCGGTGC AAACCTCGTC ACCAAGGCGA ATATGGCCGA CCCGAAGATC 
GACGCGCTGC TGAACCCGAA GATCAAGTAA

Protein sequence

MSFVKSLLSR RAFTALAGAA VIASAMPAPS FAADVTIPII VKDTTSFYWQ IVLAGARKAG 
KDLGVNVPEL GAQAESDVNG QISILENAVA GKPAAVVISP TEFKALGKPI DEAAKSVPII 
GIDSGADSKA FKSFLTTDNV QGGRIAADGL AAAIKGATGK EEGEIVILTN LPGVGSLEQR 
REGFLDQVKT KYPGLKVIAD KYGDGQATTG LNMMTDLITA NPNLVGIFAS NLIMAQGVGQ 
AIAENKLGEK IKVIGFDSDD KTVGFLKDGA IAGLVVQDPY RMGYDGVKTA LAVSKGEKVE 
ENVDTGANLV TKANMADPKI DALLNPKIK