Gene Rleg_1600 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_1600
Symbol
ID	8012675
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	1591350
End bp	1592579
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	58%
IMG OID	644824186
Product	major facilitator superfamily MFS_1
Protein accession	YP_002975427
Protein GI	241204331
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGATT CAGTTGCAGC ACAGAAAGTC GATGGCGGCG AGTTTGCCGT TTTGTGCATC 
GGAGGGTTTC TTCTTTCGAT TGCCTATGGC GTGACCTTTC TGATCCCGGT GCTGGTTGGC 
CAGCGTGGTG GCGACGAGGC GCTGGCCGGC CTGATCATTT CGGCTGCGAC TGTCAGCACC 
GTCATTCTCG TGATCCTGTC CGGCCACATC GCGGATGCCA TTGGCTCGGC GCGGGCGGTG 
GCTGTTTCGG GATTGTTTCT TGCCGCGTCA GCGCTGGGAT TCGCCATGGT TCCCTCAGCT 
GGGCTGAGCC TGATGGTGGT CGGTTTCATC CTCGGCATAG GCTGGGGCAC CTTCTATGCG 
CTCGGCCCTA TTCTGGTCGC CGCGATCGTC GAACCCGAAC ATCGGATCCG GTTTTTTGCC 
CTGCTTTCGG GATCGATGAT GTCGGGCATC GGAGCCGGAC CGATCATTGG CCGCATTGCT 
ACCAGCTGGT CGATGCCGAT CGAGGCGGCC TTCGCATTTG CGTTCCTTGC CAGTCTCGCC 
GGCGGTGCGC TTTACTTTTT GCTCCATATC CGGCTGACCA ATGCCGGCAA GATTTTGCCC 
CATGTTAACA AGATCTCATT TGGCTCAGCA CGCGAGGTGA TCGGCTCGCG GGCCATCTAT 
TCCATCGTCA TGGTCGGCAT CGGCGGCGCG ATTTTCGGCG GGCTGTCCAG CTTTCAGACC 
AGCTACGCCA AGGCGCACGG ATTCGACTAC TCCCTGTTCT TCATCGGCTT CACGTCCGCC 
GCGATTCTGA GCAGGCTGTT CGTGGCGGGA TATGTGGTCA AGAAAGACCC ACTCTATTCG 
CTTGTGGTCC TGACAAGTCT GACGCTGGCA TCGATCGTGC TGTTCCTGAT GCTGACATCA 
AATCAGTTTG CCTATCTGGG AGGCGCGGCG ATGCTGGGAG TGGGCTATGG CTTGACTTAT 
TCCGTCATCA ACGGCCTGGC GGCCAATGAG GCTCCCGCCG GCCTTATGCC GCAATCGCTG 
CTGTTATTTT CGCTCGCCTA TTCCATCGGC GTCTTCGGCT TTCCACTGAT CGCCGGCAAT 
CTGATCGTTT CCTCCGGCGT GCAGACCATG CTGTACGTCG TGCTTCTGCT TGCCGTCCTG 
AATTTTGCAA TCGTCCTGTT TCGTGTTGCC CACCGTGCGA CGCAAGAACG AAACAAAGCA 
TCCGTAGGAG ACAATACAAG CACTCTATGA

Protein sequence

MSDSVAAQKV DGGEFAVLCI GGFLLSIAYG VTFLIPVLVG QRGGDEALAG LIISAATVST 
VILVILSGHI ADAIGSARAV AVSGLFLAAS ALGFAMVPSA GLSLMVVGFI LGIGWGTFYA 
LGPILVAAIV EPEHRIRFFA LLSGSMMSGI GAGPIIGRIA TSWSMPIEAA FAFAFLASLA 
GGALYFLLHI RLTNAGKILP HVNKISFGSA REVIGSRAIY SIVMVGIGGA IFGGLSSFQT 
SYAKAHGFDY SLFFIGFTSA AILSRLFVAG YVVKKDPLYS LVVLTSLTLA SIVLFLMLTS 
NQFAYLGGAA MLGVGYGLTY SVINGLAANE APAGLMPQSL LLFSLAYSIG VFGFPLIAGN 
LIVSSGVQTM LYVVLLLAVL NFAIVLFRVA HRATQERNKA SVGDNTSTL