Gene Rleg2_0949 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_0949
Symbol
ID	6979667
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	971851
End bp	973068
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	66%
IMG OID	643395660
Product	major facilitator superfamily MFS_1
Protein accession	YP_002280469
Protein GI	209548552
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGAGA TCGCCATCAA TGATTCCATC GGAAGCCAGC CGGATGACGA GCTGCCGTCG 
GCAACGACCG TCGCCCTGGT TCAGCTGGCG CTCGCCTGCG GCGGCTTCGG CATCGGCACC 
GGCGAATTCG CGATCATGGG GCTGCTGCCG AATGTCGCCG ACACCTTCTC GGTGACGACG 
CCGCAGGCCG GCTACGTCAT CAGCGCCTAT GCGCTCGGCG TCGTCATCGG CGCGCCGGTT 
ATCGCCGTGC TCGCCGCGAA AATGGCGCGC CGCACGCTGT TGCTGACACT GATGCTGATC 
TTTGCCGCCG GCAATATCTT CAGCGCCATG GCGCCGACCT TCGAAACCTT CACGCTGCTG 
CGCTTCGTCA GCGGCCTGCC GCATGGCGCC TATTTCGGCG TCGCGGCGCT GGTCGCCGCC 
TCGATGGTGC CGGTGCATCG CCGCGCGCGG GCCGTCGGCC GCGTCATGCT CGGCCTGACC 
GTCGCGACGC TTCTCGGCAC GCCCTTGACG ACATTCTTCG GCCAGTCGCT CGACTGGCAG 
GTCGCATTTT TCTCCGTCGG CGTGCTCGGC CTGCTGACGG TTGTGCTGAT CTGGTTCTAC 
GTTCCCCAGG ACAGGGTTTC CAAAGAGGCA AGCTTCCTGC GCGAACTCGG CGCCTTCCGC 
CGGCCGCAGG TGTGGTTGAC GCTCGGCATC GCCGCCGTCG GCTACGGCGG CATGTTTGCG 
ATGTTCAGCT ATATCGCCTC GACGACGACC GAAGTCGCAT TGCTGCCGGA AACGGCCGTT 
CCGATCATGC TGGTGCTCTT CGGCGTCGGC ATGAATGCCG GCAATTTCAT CGGCTCGTGG 
CTGGCCGACA AATCGCTGCT CGGCACGATC GGCGGCTCGC TCGTCTACAA TATCGTCGTG 
CTGACCACCT TCTCGCTGAC CGCTGCCAAC CCCTATATGC TAGGCCTCTC GGTCTTCCTG 
GTCGGCTGCG GTTTTGCCGC CGGCCCGGCG CTGCAGACCC GGCTGATGGA TGTCGCCGCC 
GATGCGCAGA CGCTTGCCGC CGCCTCCAAC CATTCCGCCT TCAACATCGC CAATGCGATC 
GGCGCCTGGC TCGGCGGCCT CGTCATCGCC TGGGGTTACG GTTTCGCCGC CACCGGTTAT 
GTCGGCGCAG CACTTTCCTT CCTCGGCCTG TTCGTCTTCG CCGCCTCCGC ACGGCTGGAG 
CGCCGCGCCG GCGCATAA

Protein sequence

MSEIAINDSI GSQPDDELPS ATTVALVQLA LACGGFGIGT GEFAIMGLLP NVADTFSVTT 
PQAGYVISAY ALGVVIGAPV IAVLAAKMAR RTLLLTLMLI FAAGNIFSAM APTFETFTLL 
RFVSGLPHGA YFGVAALVAA SMVPVHRRAR AVGRVMLGLT VATLLGTPLT TFFGQSLDWQ 
VAFFSVGVLG LLTVVLIWFY VPQDRVSKEA SFLRELGAFR RPQVWLTLGI AAVGYGGMFA 
MFSYIASTTT EVALLPETAV PIMLVLFGVG MNAGNFIGSW LADKSLLGTI GGSLVYNIVV 
LTTFSLTAAN PYMLGLSVFL VGCGFAAGPA LQTRLMDVAA DAQTLAAASN HSAFNIANAI 
GAWLGGLVIA WGYGFAATGY VGAALSFLGL FVFAASARLE RRAGA