Gene Rleg2_5722 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_5722
Symbol
ID	6977113
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011366
Strand	-
Start bp	122462
End bp	123763
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	58%
IMG OID	643393179
Product	major facilitator superfamily MFS_1
Protein accession	YP_002277997
Protein GI	209546107
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.731406
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATGGGG AGGGAAAATT GGCCATACAA GATCTCGCTA TTTTCAAGGA ACGCGTTCGC 
AGTCCGAACA TCATCATTGC CCTTTGTGGT CTGCTGATCC TGTTCGACGG CTATGACCTG 
ATTGTGTACG GCGCAGTCGC GCCGGCCTTG CTCGGTGAAG CTAGCTGGGG CTTGACGCCC 
GGCCTGGTCG GTCGCGCTGC CTCCATCACC CTGTTCGGCA TGCTGCTGGG CGCTCTCGTT 
GCGGGAACGC TCGCTGACAG GATAGGCCGT CGCAAGGTGA TCATAGGCAG TCTACTGAGC 
TTCTCCGTCA TGATGATCGG CAGCGGTCTT GCGCCGAACT TTCTCGTTTT CGAGGGAACA 
CGATTTCTCG CGGGTCTGGG CCTTGGAGCT CTCTTTCCCA CGGTAACCGC GTTGATCATC 
GAGTTTTCTC CGCCGAAACG GAAGGCAATC GCCTATTCGA TTGCACTTCT TGGTTATCTC 
GCCGGCGGCA TCATTTCGGG TATCCTTGGA ATGTTGCTGA TACAGAAATA CGGATGGCGG 
CCACTGATGA TCATCGGCGG CGCACCGAGC CTGCTTCTGC CTTTCTTCAT CCGTCTCATA 
CCCGAGTCCC CCGAATGGCT GGCGACGAAG AGCCGCCAGC CCGAAGCCAA CCAGATCGCA 
AACCAGTACG GGCTGCCCAA TCCTGTCGCC CGGCCGGTTG CGCCACGCCA GGCCGGCATC 
GTATCGCTGT TTTCCGAAGG TCGCCTGCTG CCGACCTTGA ACGCATGGGG CATCCACTTC 
TGTTCGCTTC TGTTGACATT CGGCATGGTC AACTGGCTCC CGACCATCAT GAACAAGATG 
GGCTATGACC TCGGTTCTGC CCTGCTGTTT TCGGTAACGC TCAATCTCGG AGCCGCAATC 
GGCCTCCTGA TTGGCGCAAG GATTGCCGAC CGCGGAAATG TCAAAATTGT CGTGTCAGGC 
ATGTTTCTTC TCGGAGCCTG CTCGATCTGG TTGCTGACGC AGGTGGATCA GGGCCTCCAG 
GTCTATGGTC TCGTCGCACT TGCAGGGACC GGAACGATCG GCACGCAGAT CCTCGCCAAT 
ATTCTGGTTG GAAACCTCTA TCCGGTCGAG ATTCGTGGAA CTGGCCTTGG CTTCTCGCTC 
GGCATCGGCC GTATCGGAGG TATGATAGGA CCGGCCATCG GTGGTGCGGT TCTCGGCGCA 
GGCCTGGCTC CGCAGTGGAA TTTCTACATC TTCGCAACGG TAGGAGCCTT GGGATGCATC 
CTCGCGCTCA TGACATTGCT GTATTCCAAA AAGGCTGACT GA

Protein sequence

MYGEGKLAIQ DLAIFKERVR SPNIIIALCG LLILFDGYDL IVYGAVAPAL LGEASWGLTP 
GLVGRAASIT LFGMLLGALV AGTLADRIGR RKVIIGSLLS FSVMMIGSGL APNFLVFEGT 
RFLAGLGLGA LFPTVTALII EFSPPKRKAI AYSIALLGYL AGGIISGILG MLLIQKYGWR 
PLMIIGGAPS LLLPFFIRLI PESPEWLATK SRQPEANQIA NQYGLPNPVA RPVAPRQAGI 
VSLFSEGRLL PTLNAWGIHF CSLLLTFGMV NWLPTIMNKM GYDLGSALLF SVTLNLGAAI 
GLLIGARIAD RGNVKIVVSG MFLLGACSIW LLTQVDQGLQ VYGLVALAGT GTIGTQILAN 
ILVGNLYPVE IRGTGLGFSL GIGRIGGMIG PAIGGAVLGA GLAPQWNFYI FATVGALGCI 
LALMTLLYSK KAD