Gene Rleg_6131 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_6131
Symbol
ID	8016088
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012852
Strand	+
Start bp	174898
End bp	176199
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	59%
IMG OID	644827437
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_002978637
Protein GI	241258753
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1175] ABC-type sugar transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.336729
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.227822
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATCGT CCAGAACGCT CGGACTGGTG ATGATCGCGC CTGCGGCGAT CATGATCGTT 
CTTTTCTTCC TGATGCCGGT CGTTCTGACG GCGGTCTTTT CGATGACCAG CATGACGACG 
GCGACCGGTA TTTCCGGCGG CGTCTATCAG ATCGCACCCA ACTCCATGAT TGCGCTAAAA 
TCGGCAATAC CGGACATTGC CGCCGAGATG GCCGAACCGC GCTACACGAT CGACGAGGCG 
GGCCTCAAGG CCGTCGAAGG ACTCGGGCTT GCGCCGGGGA TTGCTGGGGA ATTGCGCGCC 
AAACATGCAG GTGAGGTGTT CACGGCACGC CGCGACGTCG AGCGCATGCT CAAGGATCTC 
GCCGACCGGC CTTCGACGCG CGACGTCAAG CAGATTTCCG AACAGTTCAA CCGCTCCGTC 
CTCAACACCC GCTTCGACAG CAAGGAGCAG CTCTTTTCGG CGCTGGATAG TCTGGGTTTC 
AAACTGACAC CGGAGCAGAA GGAAACGGTC GCCAAGGCCA CCTATACCGG CTGGGTTTGG 
ACGACCGACA ATTTCTCGCG CATGACCACC TCACCCGATA TGGCGCGTGT ACTCTTGAAT 
ACCGTGCTCT ACGTCGCGCT GGTGCTGATG CTGTTCAATG TCGGCTATGC GCTGCTACTT 
GCCATTTGGA CGCATTACAT GCCGCCGACG CCGGCCTCGA TCTTCCGCGG CATCTGGCTC 
CTGCCGCGCA TTACCCCTGT CGTCATCTAT GTCATGCTAT GGAAGTGGCT TGCCTGGGAT 
ACCGGCTTCA TTTCGATCCT GATGGGCAAG TTCGGCTATC CGCCAAAGAA CTACCTTCTC 
GACAACGCTT ACAACGCCTG GTTCTTCGTC GTGTTGATCA ACGGCTTCAT CGGCGCCTCG 
ATGGGCATGC TGGTGTTCTC CTCGGCTATG AAGGCCATTC CGAAGAGCCA GTTCTATGCG 
AGCGAGGTCG ACGGCGCCTC GCGCTGGCAG CAGATTCGCT ACATCATTCT GCCGCAGATG 
CGCTGGCCAA TCCTCTTTGT TACCTGCTAC CAGACCTTGT CGCTGCTTGC CTCCTTCAAT 
GAAATCCTGC TCGCCACCAA TGGCGGACCG GGCAATGCGA CCGAGGTCTG GGCGCTCTCG 
GCCTATCACA CTGCGCTGAG GAACTATGCC GGCAACCTCG AATACGGGTT GGGTGCCGCC 
ATGGCCTTGG TGCTCGTCGT CATCGGCGTG ACGCTGTCGC TCCTCTATCT GCGCGTCTTC 
AACTACGGCA CGCTTGTCGC CAAGCCCTTG ATCGAGGATT GA

Protein sequence

MKSSRTLGLV MIAPAAIMIV LFFLMPVVLT AVFSMTSMTT ATGISGGVYQ IAPNSMIALK 
SAIPDIAAEM AEPRYTIDEA GLKAVEGLGL APGIAGELRA KHAGEVFTAR RDVERMLKDL 
ADRPSTRDVK QISEQFNRSV LNTRFDSKEQ LFSALDSLGF KLTPEQKETV AKATYTGWVW 
TTDNFSRMTT SPDMARVLLN TVLYVALVLM LFNVGYALLL AIWTHYMPPT PASIFRGIWL 
LPRITPVVIY VMLWKWLAWD TGFISILMGK FGYPPKNYLL DNAYNAWFFV VLINGFIGAS 
MGMLVFSSAM KAIPKSQFYA SEVDGASRWQ QIRYIILPQM RWPILFVTCY QTLSLLASFN 
EILLATNGGP GNATEVWALS AYHTALRNYA GNLEYGLGAA MALVLVVIGV TLSLLYLRVF 
NYGTLVAKPL IED