Gene Rleg_1859 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_1859
Symbol
ID	8012913
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	1843584
End bp	1844849
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	64%
IMG OID	644824449
Product	major facilitator superfamily MFS_1
Protein accession	YP_002975681
Protein GI	241204585
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0875597
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.419035
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACG AACTGCGTCC GATCGATGCT GCCGCAAGCG CCGTGTCGCA GAAACTTGAC 
TGGCGGCTGA TGCTGCCGGT TTTCATCATC GTCAGCCTCG ATGCCGCCAG CAGCGGCGCC 
ATCCTGCCGT TCCTGCCATT CTACCTCCGG AATCTCGGGG CGTCGCCGCT CGTTCTCGGG 
CTTGTTCTCG GTGCGGAAGC GCTCAGCCAG TTCGTTGCCG CGCCCTGGCT AGGTCAACTT 
TCCGACCGTT GCGGACGCAA GAGGGTTTTG CTCGCCAGCC AGGCCGGAGC GTTGATCAGC 
CTTTTGCTGC TGGCGCTTGC CAACAGCGTC GTCTTCGTGC TGCTGGCGCG GATCCTGCTC 
GGCCTGACCG CAGCCAATTT CTCGGCCGCG GCAGCCTATG CTGCCGACAA CAGCAGCGCC 
ACCACCCGGC GCCAGGCCAT CGGCATTCTG AGTGCGGGCC TCGGCCTTGG CGGAATGATC 
GGACCGAGCC TCTCCGGATA CCTTGCCGAC ACGTCTCTGA CGGCGCCGAT CTGGGTCGCG 
CTTGCCCTGT CGGCGACCAG CATGCTGGTG ACCGGGCTTT GGCTGAAAGG CGCCGATGCG 
CCCGGCCGGT TCGGCAACGA CAGCGAAGCG GACGAGACGG TCGGCGAGAA GGTTTCCTTC 
CGAACCCTGC TCGCCTCGCC GGTCATCCGC GTCCTCGTCG CCGTTCTTCT CTGCCACTAT 
TTCTCATACG GGATGTTCAG TTCGCAGCTC GCCGTTTTTC TGGCGGATAC ATTCACCTGG 
AATGAACATG CGTTCGGTCC GAAGGAGCTG GGTTACCTCC TGAGCGCCGA CGGTGCGATC 
AACGTCCTGG TCCAGCTTTT CCTGCTGAGA TGGCTCGGCG GCACCTTCTC TGAGCGAGGC 
CTGATCGTCC TGGTCTTCAC CATTCTCTCA ATTGGTTATG TCACGGCTGG CCTCGCCACC 
GACATCGTTA CCCTCGCCTT CGCCGTCCTT TGCATCAGCA CGGGCGTGGC ATTGGCGCGG 
CCGACATTCG TTGCAGCACT CTCCGTGCAT GTGCCGCAGC AACGCCAGGG CATCGTCATG 
GGAGCAACGC AGTCGCTCGT CGCCGTCACC GACATCGTCA CGCCGGTCCT TGCCGGCGTC 
ATTCTCGGGC AGAGCTTGTA TGGCGCATGG ATCGGCGCCG TGGTGGCGAT CGCACTGGTC 
GGAGCCGTCA TCGCCCGCAG CCGGCTGCCC GCAATCGATC CGGAGACGAG TGCTACCGGC 
GGCTGA

Protein sequence

MSDELRPIDA AASAVSQKLD WRLMLPVFII VSLDAASSGA ILPFLPFYLR NLGASPLVLG 
LVLGAEALSQ FVAAPWLGQL SDRCGRKRVL LASQAGALIS LLLLALANSV VFVLLARILL 
GLTAANFSAA AAYAADNSSA TTRRQAIGIL SAGLGLGGMI GPSLSGYLAD TSLTAPIWVA 
LALSATSMLV TGLWLKGADA PGRFGNDSEA DETVGEKVSF RTLLASPVIR VLVAVLLCHY 
FSYGMFSSQL AVFLADTFTW NEHAFGPKEL GYLLSADGAI NVLVQLFLLR WLGGTFSERG 
LIVLVFTILS IGYVTAGLAT DIVTLAFAVL CISTGVALAR PTFVAALSVH VPQQRQGIVM 
GATQSLVAVT DIVTPVLAGV ILGQSLYGAW IGAVVAIALV GAVIARSRLP AIDPETSATG 
G