Gene Rleg_2985 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_2985
Symbol
ID	8013904
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	2982023
End bp	2983189
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	65%
IMG OID	644825555
Product	major facilitator superfamily MFS_1
Protein accession	YP_002976783
Protein GI	241205687
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.0895325
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCTCG CCCTCCTCGT TCTTGCCTTG AGCTCATTTG CGATAGGCAC CACTGAATTC 
GTCATCATGG GTCTGTTGCC GGAGGTCGCC GCCGATCTCT CGGTCAGCAT CCCGCAGGCC 
GGATGGCTGG TGACCGGTTA TGCCCTGGCG GTCGCGATCG GCGCCCCTGT GATGGCGATT 
TCGACCGCGA AGTTGAAGCG CCGTACCGCC CTGATTGCGC TGATGGCCTT CTTCATCGCC 
GGCAACCTGC TGTGCGCTCT GGCGAGCGAC TACTGGGTGC TGATGATCGC CCGTGTCGTG 
ACAGCACTCT GCCACGGCGC CTTCTTCGGC ATCGGCTCGG TGGTCGCCGC CGGCCTCGTC 
GCCGAAGACC GCAAGGCCCG AGCCGTCGCG CTGATGTTCA CTGGCCTGAC GCTCGCCAAC 
GTTCTCGGCG TGCCGCTCGG CACCGCGATC GGTCAGGCCT ATGGCTGGCG CGCCACCTTC 
GGCGTCGTCA CCGTCATCGG TATCTTCACC ATATCAGGCC TGATCGCCAT CCTGCCCAGG 
GACAAGCAGC AAGAAAACGG CAGCATCCTG CGCGAGATTG CGGCACTCAG GAATGGCGGT 
CTGTGGCTAG CACTCTCCAC CACCGTCTTC TTCGCCGCCT CTATGTTCAC CCTCTTCACC 
TATATCGCGC CGCTGCTGCG CGACGTCACC GGCGTTTCGC CGGAAGGCGT CACCTGGACG 
CTGTTCCTGA TCGGCCTCGG GCTGACCATC GGCAACCTCG TCGGCGGCAA GCTTGCCGAT 
TGGCGGCTCG GCGCGACGCT AGCCGGGGTC TTTGCCGCGA TCGCCATCAC TTCGATCGCC 
TTCAGCTATA CGAGCCGCTT CTTCATCCCG GCTGAAATCA CCCTCTTCCT CTGGGCGATG 
GCAAGCTTTG CCGCCGTACC GGCGCTGCAA GTCGGCGTCG TCGGCTTCGG CAAGGACGCC 
CCGAACCTCG TCTCGACGAT CAACATCGGC GCCTTCAACA CCGGCAATGC GCTCGGCGCA 
TGGGTGGGTG GCTTGGTCAT CGACGCCGGC TTCGATCTGA CCCGCGTTCC GCTCGCCGCG 
GCCTTGATGG CCCTGATCGG CCTCGGGGCG ACGGCGCTCA CCTATCTCTC CGCCAGGGGC 
CGGGCTGCCC TCGCCCCTGC CGAGTGA

Protein sequence

MPLALLVLAL SSFAIGTTEF VIMGLLPEVA ADLSVSIPQA GWLVTGYALA VAIGAPVMAI 
STAKLKRRTA LIALMAFFIA GNLLCALASD YWVLMIARVV TALCHGAFFG IGSVVAAGLV 
AEDRKARAVA LMFTGLTLAN VLGVPLGTAI GQAYGWRATF GVVTVIGIFT ISGLIAILPR 
DKQQENGSIL REIAALRNGG LWLALSTTVF FAASMFTLFT YIAPLLRDVT GVSPEGVTWT 
LFLIGLGLTI GNLVGGKLAD WRLGATLAGV FAAIAITSIA FSYTSRFFIP AEITLFLWAM 
ASFAAVPALQ VGVVGFGKDA PNLVSTINIG AFNTGNALGA WVGGLVIDAG FDLTRVPLAA 
ALMALIGLGA TALTYLSARG RAALAPAE