Gene Rleg2_1733 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_1733
Symbol
ID	6980470
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	1772990
End bp	1774792
Gene Length	1803 bp
Protein Length	600 aa
Translation table	11
GC content	60%
IMG OID	643396456
Product	extracellular solute-binding protein family 5
Protein accession	YP_002281246
Protein GI	209549329
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4166] ABC-type oligopeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.197004
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCCGGA TCGTCGTCCC CCTCGTCCTC TCGCTGCTGT GCGGCGCTGT TGCCGCCGAG 
CCGCTGCATG GCATCGCGAT GCATGGCGAG CCTGGCTTGC CGGCCGATTA CAAACACTTC 
CCTTACGTCA ATCCCGACGT GAAGAAGGGC GGCAAGATCA CCTATGGAGT CGTCGGCACC 
TTCGACAGCC TCAACCCGTT CATTCTGAAA AGCATGCGCA CGACGGCGCG CGGCATGTGG 
GATCCGGAAT ATGGCAATCT CGTCTACGAA TCGCTGATGC AGCGCTCCAG GGACGAGCCC 
TTCACGCTCT ACGGCCTTCT TGCCGAGACG GTGGAATGGG ACGACGCCCG GAGCTTCATC 
CAGTTCAACC TCAATCCGAA GGCGAAATGG GCAGATGGCC AGCCGGTGAC GCCCGAGGAT 
GTGATGTTCA CCTTCGAGCT GATGCGCGAC AAGGGGCGCG TGCCCTTCGC CAACCGCCTC 
AACGTCGTCG CCAAGATGGA AAAGGTCGGC GAAAACAGCG TGCGCTTCAC CTTCAACGAC 
AAGGCCGACC GCGAGACTCC TTTGATTTTC GGTCTTTTCC CGGTCCTGCC GAAACACGCG 
ATCGATCCGG AAACCTTCGA CCGCTCGTCG CTGACACCGC CTGTGGGATC CGGTCCCTAC 
AAGGTGAAGA CGGTGAAGCC CGGCGAGAGC ATCACCTATG AGCGCGATCC CAATTACTGG 
GGCAAGGACA TTCCCTCCAA GGTCGGCACC GACAATTACG ATCAGATCAC CGTCCAGTAT 
TTCCTGCAGG ACACGACGCT GTTCGAGGCC TTCAAGAAGG GCGATGTCGA CGTCTATCCC 
GACGGCAATC CCGGCCACTG GGCCAATGCC TATAATTTCC CCGCGGTCAC CTCAGGCGCC 
GTCGTCAAGG ACGTATTCAC ACCAAAACTG CCGAGCGGCA TGCTCGGCTT CGTGTTCAAC 
ACGCGCCGGC CGATCTTTGC CGACACCAAG GTGCGCGAAG GCCTGTCGTT GGTGTTCGAT 
TTCGAATGGG CAAACAAGAA CCTTTATTCC GGCGCCTATA AGCGCACCCA GAGCTTCTGG 
CAGAATTCGG AGTTGTCCAG TTTCGGCGTT CCCGCCAATG CGGCCGAACT TGCGTTGCTC 
GGACCGATCA AGGACAAAAT CGCACCCGCG ATTCTCGACG GCACCTACAA GCTTCCGGTC 
ACTGACGGCT CCGGCCGCGA CCGCGATGTG CTGAAGCAGG CCGTTGGACT GTTGAAACAG 
GGCGGCTATA CGATCCAGGG CGGCAAGATG CTGGATGCCT CCGGCCGCCA GCTCGCCTTC 
GAGATCATGA CGCAGAACGC CGATCAGGAG AAACTCGCCA TTGCCTATCA GCGTTCGCTG 
CAGACAATCG GCATCGCCGC TTCGATCCGC ACCGTCGACG ATTCGCAGTA TCAGAGCCGG 
ACGAATAGCT TCGACTACGA CATGATCATG AAGTCTTACA CCTCGTCGCT GTCGCCCGGA 
AACGAACAGC TCGGCCGCTG GTCGTCGGCT GCGCGCACGC GCGAGGGTAC GGACAGTTTT 
GCCGGCGCCA ATGATCCCGA TATCGACACG CTGATCGATC ATCTGCTGAG GGCACGCTCG 
GCTGAGGATT TCACCGCGGC GGTGCGCTCC TACGATCGGC TGCTGCTTTC CGGCCATTAC 
GTGCTGCCGC TCTATCATAT CGACCAGCAA TGGGTGGCTC ACAGCAAACG CATCGGCGGT 
CCCGACAGCG TACCGCTCAA TGGCTATCAA CTACCGGTCT GGTGGGATAC GAGCGTGCAG 
TAG

Protein sequence

MLRIVVPLVL SLLCGAVAAE PLHGIAMHGE PGLPADYKHF PYVNPDVKKG GKITYGVVGT 
FDSLNPFILK SMRTTARGMW DPEYGNLVYE SLMQRSRDEP FTLYGLLAET VEWDDARSFI 
QFNLNPKAKW ADGQPVTPED VMFTFELMRD KGRVPFANRL NVVAKMEKVG ENSVRFTFND 
KADRETPLIF GLFPVLPKHA IDPETFDRSS LTPPVGSGPY KVKTVKPGES ITYERDPNYW 
GKDIPSKVGT DNYDQITVQY FLQDTTLFEA FKKGDVDVYP DGNPGHWANA YNFPAVTSGA 
VVKDVFTPKL PSGMLGFVFN TRRPIFADTK VREGLSLVFD FEWANKNLYS GAYKRTQSFW 
QNSELSSFGV PANAAELALL GPIKDKIAPA ILDGTYKLPV TDGSGRDRDV LKQAVGLLKQ 
GGYTIQGGKM LDASGRQLAF EIMTQNADQE KLAIAYQRSL QTIGIAASIR TVDDSQYQSR 
TNSFDYDMIM KSYTSSLSPG NEQLGRWSSA ARTREGTDSF AGANDPDIDT LIDHLLRARS 
AEDFTAAVRS YDRLLLSGHY VLPLYHIDQQ WVAHSKRIGG PDSVPLNGYQ LPVWWDTSVQ