Gene Rleg2_1780 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_1780
Symbol
ID	6980517
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	1823868
End bp	1825097
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	65%
IMG OID	643396502
Product	major facilitator superfamily MFS_1
Protein accession	YP_002281292
Protein GI	209549375
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.378935
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0668238
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGTCA TGCATCAGGA CTCGGCCGAC CCGGTAGCCG CAAAGCGCAA CTCCTGGGTG 
CTCACCGTTG CGCAGGCCTT CGGGGGCGCC AATGCTCCAA TCATCGTCTC GCTCGGCGGC 
CTGGTCGGGC AGCATCTGTC GACCGATCCG GATCTCGTCA CGCTTCCCGT CAGCCTGCTC 
AGCCTTGGGC TGGCACTCGG GACTCTGCCT GCCGCCTGGG TGATGCGTCG GTTCGGACGC 
AAGCCCGGAT ATCTGCTGGG CTCGGTGACC GGCATGGTTT CGGGCCTGAT CGCTGCACTG 
GGGATCGTGC TCTCCAGCTT CCTGGTTTTC TGCCTCGGCA CCTGCCTCGC CGGTTTCTAT 
TCCTCCTATG TGCAGAGCTA CCGCTTCGCC GCGACCGACA ACACCACTGC AGCGCAGAGC 
CATAAAGCGA TCGTCCGCGT CATGGTCGGC GGCCTGATCG CCGCGATCAT TGGCCCGCAG 
CTCGTCATCT GGACGCGCGA CGCTTTGCCG GGGACACCCT TCGCCGGGAG CTTCCTCAGC 
CAGGCCGTTC TCGCCGCCCT GGCGTTTCCG GTGCTGCTCA TGCTTCGCAC ATCGACGCCG 
CCGACGGCTC ACGCGTCGGA AAGCGCCCTG GAGCGGCCCC TTGCCCAGAT TCTGACATCG 
CCGCGCTATC TGCTCGCCAT CGCAACCGGT GTCGTGTCCT ACGGGCTGAT GACCTTCGTG 
ATGACTGCGT CGCCGATCGC GATGGTCGGG CATGGTCACT CGATCGACCA GGCGGCATTG 
GGCATCCAAT GGCATATTCT CGCCATGTAT GCGCCGAGCT TCGTCACCGG CCGCCTGATG 
GTGCGTTTCG GCAAGGAACG GGTCGCGGCC GTCGGTCTGC TCCTCATCGG CTGCTCGGCG 
GCCGTCGCGC TCTCCGGCTT CGACATCTCC CATTTCTGGC TCTCGCTGGT TCTGCTCGGG 
ATCGGTTGGA ACTTCGGCTT CATCGGAGCA ACCGCCATGG TGGCCGACTG CCATACGCCG 
GCCGAACGCA GCAAGGTACA GGGGGCAAAC GACTTCGTGG TCTTCGGTAC GGTCGCCTGC 
GCGTCCTTCT CCGCCGGGTC GCTTCTCCAC AGCTCCGGCT GGGAAACGAT CAACTGGATC 
GTGCTTCCGG CAGTCGCCCT GGTGCTGGTT CCCTTGGTCT GGCGGGCGGC GCGGCCCGGC 
GATCACTCGG GAAGTCCGGC CTTGCGGTAG

Protein sequence

MNVMHQDSAD PVAAKRNSWV LTVAQAFGGA NAPIIVSLGG LVGQHLSTDP DLVTLPVSLL 
SLGLALGTLP AAWVMRRFGR KPGYLLGSVT GMVSGLIAAL GIVLSSFLVF CLGTCLAGFY 
SSYVQSYRFA ATDNTTAAQS HKAIVRVMVG GLIAAIIGPQ LVIWTRDALP GTPFAGSFLS 
QAVLAALAFP VLLMLRTSTP PTAHASESAL ERPLAQILTS PRYLLAIATG VVSYGLMTFV 
MTASPIAMVG HGHSIDQAAL GIQWHILAMY APSFVTGRLM VRFGKERVAA VGLLLIGCSA 
AVALSGFDIS HFWLSLVLLG IGWNFGFIGA TAMVADCHTP AERSKVQGAN DFVVFGTVAC 
ASFSAGSLLH SSGWETINWI VLPAVALVLV PLVWRAARPG DHSGSPALR