Gene Rleg_5688 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5688
Symbol
ID	8016651
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012853
Strand	-
Start bp	270041
End bp	271297
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	60%
IMG OID	644827841
Product	major facilitator superfamily MFS_1
Protein accession	YP_002979041
Protein GI	241518413
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0510347
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.192354
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGATC CCGATCGGAT TGGTGAATTC TGGCGGAAAG CCGCAGGGCT TCGTGCAATC 
CTGCATGTCA TGGCGAGCAT CTGCATCGTC GCGACTGGCA ATTCTCTTCT GACGACCACG 
GTTTCTCTGC ACCTCAGTGA CCCCGCAATC GATCCCCACA TCGTCCAGTT GTTGCTGACG 
GCGTTTCCCG TAGGCTTCCT TGCCGGCTGC CTCTCAGCTC GTGTCATGGT CGTCCGCTTG 
GGACACGAGC GGGCTTTCCT GGCCGTCGCA TTGCTCGCTG CTTTCGGCGC CTGCGGCTAC 
ATGCTGACGC AAGCCGCTCC GGTCTGGTTC TGCCTGCGTC TGATAAACGG TTTTTCCATC 
GCAACGCTGT TCGTCGTGTC CGAAAGCTGG ATCAATCTCT ACGCTGACCA GAAGAACCGC 
GGAGCTTATT TCTCGCTCTA TATGCTGATG ACGTCGCTGG CGACCCTGTT TGCGCAATTG 
CTTGTCGAAG CGGCCGGAGC GGACTCTCCC CATCTCTTTC AGATCGTGCT CGGCGTCATC 
CTTCTTGGAC TGATCTACGC CCGCTTTATC GGTGGACCCT GGCCCACCTT GCGCCTGCCG 
CTGGCAGTAG CGGTCGAGGC CGGCAACGCC CACTCCGGGC ATCGCTATGG CATCTGGCGG 
CTCGTCGCTC TCGCACCGGT GGCTGTCGTC TGCGTCTTTC AAGCGGGCAT GACGAATATG 
AATGTCTATA CGATGACGCC GATCTATGCG GAGCGGGTGC ACCTCGACGC GGCGGTGGCG 
GTGACACTGG TAACCGCTTT CAGCCTGGGC GGCATGCTCG CTCAGGCCCC GGTCGGATGG 
TTGTCGGATC GTATGGACCG GCGCGTTCTA CTTCTCGTTC AGGGATTGGC GGGAGCAGGA 
CTGTGCGCAG CAATCGCCTG GCCCGGAAGC TATCCGCAGA TGCTTCTCTA CGGTCTGTTT 
TTCGCCTATG GCGCAATTGC GCTGACGATC TATCCGGTCG GTATCGCTTA CGCTAACTCA 
CAGCTCGATA GCCGCCATAT GGTCTCGGCA TCGGGTAGCC TGCTGCTCCT TTATTCGATC 
GGCAACATCA TGACACCTGG GCTCGCCGCC CAGCTGATGG AGCTGTTTGC ACCGCAGGCA 
CTCTTCCTTC TGCTCGGGAG CGGCGCGTTC CTGGTTGCTG TCGCTGCCTG CTTCAATCTC 
TTTCGCCGTC CGATCGGCGC CACCAAACCT TGCCTTGTTT CGGGAGGAAG CGAATGA

Protein sequence

MRDPDRIGEF WRKAAGLRAI LHVMASICIV ATGNSLLTTT VSLHLSDPAI DPHIVQLLLT 
AFPVGFLAGC LSARVMVVRL GHERAFLAVA LLAAFGACGY MLTQAAPVWF CLRLINGFSI 
ATLFVVSESW INLYADQKNR GAYFSLYMLM TSLATLFAQL LVEAAGADSP HLFQIVLGVI 
LLGLIYARFI GGPWPTLRLP LAVAVEAGNA HSGHRYGIWR LVALAPVAVV CVFQAGMTNM 
NVYTMTPIYA ERVHLDAAVA VTLVTAFSLG GMLAQAPVGW LSDRMDRRVL LLVQGLAGAG 
LCAAIAWPGS YPQMLLYGLF FAYGAIALTI YPVGIAYANS QLDSRHMVSA SGSLLLLYSI 
GNIMTPGLAA QLMELFAPQA LFLLLGSGAF LVAVAACFNL FRRPIGATKP CLVSGGSE