Gene Rleg_3752 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_3752
Symbol
ID	8014585
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	3803164
End bp	3804474
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	61%
IMG OID	644826315
Product	extracellular solute-binding protein family 1
Protein accession	YP_002977534
Protein GI	241206438
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.561914
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATTGA GAACTTTTCT GCTGGGCGCC TGCTCAGCAC TGGCGTTTGC CGGTATGGCT 
TCGGCCGAAA CGCTGACAAT CGCGACCGTG AATAACGGCG ACATGATCCG GATGCAGAAG 
CTGACGGATG ATTTCAAGGC GAAGAACCCC GGTATCGACC TTGAATGGGT AACCCTGGAA 
GAAAACGTGC TGCGCCAGAA GGTCACGACC GATATCGCGA CCAAGGGCGG CCAGTACGAC 
GTTCTGACGA TCGGCACCTA TGAAGTTCCG ATCTGGGCAA AACAGGACTG GTTGCTGCCG 
CTCGACAATC TCGGCGCCAA TTACGACGTC GACGACTTGC TGCCGGCAAT TCGCAGCGGC 
CTGACTGTGG ACGGCAAGCT CTATGCTTCG CCGTTCTATG GTGAAAGCTC GATGGTCATG 
TACCGTAAGG ACCTGTTCGA AGCTGCCGGC CTGAAAATGC CCGACGCGCC GACCTGGGAC 
TTCGTTGCCG ACGCTGCCCG CAAGATCACC AACAAGGACA AGGAAATCTA CGGCATCTGC 
CTTCGCGGCA AGGCCGGCTG GGGCGAGAAC ATGGCCTTCT TGACGGCCAT GTCCAATTCC 
TTCGGCGCAC GCTGGTTTGA CGAGAAGTGG AAGCCGCAGT TCGATCAGCC GGAATGGAAG 
GACACGCTCG ACTTCTACGT CAAGCTGATG AAGGACGCCG GCCCTCCGGG CGCCTCCTCC 
AACGGCTTCA ACGAGAACCT GGCGCTCTTC CAGACCGGTA AGTGCGGCAT GTGGATCGAT 
GCAACGGTTG CCGCTTCCTT CGTCGCCGAT CCGAAGCAGT CGCAGGTCGC CGACAAGGTC 
GGCTTCGCGC TCGCCCCGGA CAAGGGCCTC GGCAAGCGCG GCAACTGGCT CTGGGCCTGG 
AGCCTCGCCA TCCCGGCAGG GACCCAGAAG GCCGAAGCTG CTGAGAAGTT CGTTGCCTGG 
GCAACCAGCA AGGAATACAG CAACCTCGTC GCCGAGAAGG AAGGTTGGCT GAACGCACCT 
CCGGGCACCC GCAAATCGCT CTATGCGAAT GCGGACTACC AGAAGGCGGC TTCGTTCGCC 
AAGATGACGC TCGACTCGAT CGAGTCGGCC GATCCGACCA AGCCGACCGT CAAGCCGGTT 
CCCTATGTCG GCGTCCAGTT CGTGGCGATC CCGGAATTCC AGGGCATCGG CACGGCGGTG 
GGCCAGCAGT TCTCCGCAGC TCTTGCCGGC CAGCTCTCGG TCGACCAGGC CCTGCAGGCA 
GCGCAGCAAC TGACCACTCG CGAAATGACC AAGGCCGGCT ACATAAAATA A

Protein sequence

MTLRTFLLGA CSALAFAGMA SAETLTIATV NNGDMIRMQK LTDDFKAKNP GIDLEWVTLE 
ENVLRQKVTT DIATKGGQYD VLTIGTYEVP IWAKQDWLLP LDNLGANYDV DDLLPAIRSG 
LTVDGKLYAS PFYGESSMVM YRKDLFEAAG LKMPDAPTWD FVADAARKIT NKDKEIYGIC 
LRGKAGWGEN MAFLTAMSNS FGARWFDEKW KPQFDQPEWK DTLDFYVKLM KDAGPPGASS 
NGFNENLALF QTGKCGMWID ATVAASFVAD PKQSQVADKV GFALAPDKGL GKRGNWLWAW 
SLAIPAGTQK AEAAEKFVAW ATSKEYSNLV AEKEGWLNAP PGTRKSLYAN ADYQKAASFA 
KMTLDSIESA DPTKPTVKPV PYVGVQFVAI PEFQGIGTAV GQQFSAALAG QLSVDQALQA 
AQQLTTREMT KAGYIK