Gene Rleg2_6117 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_6117
Symbol
ID	6983190
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011370
Strand	-
Start bp	44137
End bp	45795
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	50%
IMG OID	643399139
Product	major facilitator superfamily MFS_1
Protein accession	YP_002283895
Protein GI	209551979
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.154468
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.620567
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTACAAG TAGACATACT GCCAAAAACA GAGGGGATCT CCTCAAACGA GCGACGCGTC 
ATTGTTGCTG CATCACTCGG AACAGTTTTT GAATTCTACG ACTTTTTTCT CATTGGATTG 
TTAGCTAATG AAATTTCGAA AGCATTTTTT TCCGGCGTAA ACCCAACAGC TGGTTTCATC 
TTTACGCTTC TCGGCTTTGC GGCAGGCTTT TTGTTAAGGC CGTTCGGGGC GATCGTGTTT 
GGTCGCCTTG GTGACATGGC AGGGAGAAAA TATACGTTTC TGGTGACGAT ATTGCTGATG 
GGCATATCGA CTTTCACAAT AGGTCTACTA CCGGCCTATT CTACGATAGG CCTTGCGGCA 
CCTCTTGGGT TTGTGGCGAT GCGGATGCTG CAAGGCCTCG CTCTTGGTGG AGAGTTCGGC 
GGTGCGCTAA TCTATGTTGC CGAACACGCG CCTGCGAACC GAAGGGCGGC CTGGACGGCC 
TGGGTGATAT TGACGGCCGC GCTTGGATTT CTCTTGGCAG TCGCTGTCAT CATTCCTCTA 
AGGCTGGCAA TTGGCGCTGA TGCCTTCTCT CTTTGGGGAT GGCGCGCCCC CTTTCTTGTT 
TCAATCCTAC TGCTCGGAGT TTCTTTGTGG ATTCGATTGA AATTGGACGA AACTCCCGAG 
TTCATAAGGA TGAAGGCGGA GGGAAAGGCA TCTAAAGCCC CAATCTCGGA AACGCTTGGA 
ACGTGGAAAA ACCTCCGCCT TGTGCTAATC GCTGCGCTCT GCATCGTTCC GGGGCAGGCG 
GTTGTATGGT ACACTGGCCA ATTCTACTCG TTGTTCTTTT TAACTAAAGT GTTGCGGATC 
GAAAATCTGA CAGCAAATTT TCTGCTGATC GCTGCGACGA TCATCACGGC CCCTCTTTAC 
GTTGTCTTTG GTGCGTTGTC TGACCGTATC GGTCGCCGGC CAGTTTACGT GGCTGGTTTC 
CTGCTTGCAG CTGTATTTAC GGTCCCCCTT TTCAAAGCTC TTACGCACTA CGGCAACCCG 
ACACTCGAAC AAGCGCAAAT TAATGCGCCC ATCACAATTG TATCAGGGAG TGACGCTTGT 
TCAGTACAAT TCAATCCGCT GGGCACCGCA AAACCAATCA CATCTTGCGA CATCGTGGTC 
GACGCGATCG CAAAACTTGG TCTGAATTAC AATAGTGCAC ACTCAGCAGA GTCAGCGACT 
ACAATCGTGA AGATCGGCGA CCGTGAGGTT CCTGGATACT CCGCCGATAC ATCCGACGTT 
TCCGTTAAAA AAACACGGTT TGAATCGGAA CTGAAGACAG CATTGACCGA TATGGGCTAT 
CCCTTAGGAG AAGCCGCCCA TGAAGACATC AATCAAACTA TGATCGTCGT TCTATTGTCC 
ATCCTTTTAT GCTTTGGAAC GATGACGTTC GCGCCTTCGA CAACTGCTCT ACTCGAAATG 
TTCCCTTCGC GGATACGGTA TACTGCCATG TCATTTCCCT ATCACCTAAG TGCAGCGTGG 
TTTGGTGGGT TCCTACCCGC GACAGCGTTT GCCATCGTTG CGTCCACCGG CAACATTTAT 
TCTGGGCTTT ATTATCCGGC GTGCATCGCT GCAGCTTGTA TAGTCTTGAG CACTATCTTT 
GCGAACGAGA CAAAAGGAGC GGATCTCTCC GGAGATTGA

Protein sequence

MVQVDILPKT EGISSNERRV IVAASLGTVF EFYDFFLIGL LANEISKAFF SGVNPTAGFI 
FTLLGFAAGF LLRPFGAIVF GRLGDMAGRK YTFLVTILLM GISTFTIGLL PAYSTIGLAA 
PLGFVAMRML QGLALGGEFG GALIYVAEHA PANRRAAWTA WVILTAALGF LLAVAVIIPL 
RLAIGADAFS LWGWRAPFLV SILLLGVSLW IRLKLDETPE FIRMKAEGKA SKAPISETLG 
TWKNLRLVLI AALCIVPGQA VVWYTGQFYS LFFLTKVLRI ENLTANFLLI AATIITAPLY 
VVFGALSDRI GRRPVYVAGF LLAAVFTVPL FKALTHYGNP TLEQAQINAP ITIVSGSDAC 
SVQFNPLGTA KPITSCDIVV DAIAKLGLNY NSAHSAESAT TIVKIGDREV PGYSADTSDV 
SVKKTRFESE LKTALTDMGY PLGEAAHEDI NQTMIVVLLS ILLCFGTMTF APSTTALLEM 
FPSRIRYTAM SFPYHLSAAW FGGFLPATAF AIVASTGNIY SGLYYPACIA AACIVLSTIF 
ANETKGADLS GD