Gene Rleg2_3914 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_3914
Symbol
ID	6982678
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	4059839
End bp	4061227
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	62%
IMG OID	643398637
Product	major facilitator superfamily MFS_1
Protein accession	YP_002283402
Protein GI	209551485
COG category	[R] General function prediction only
COG ID	[COG2270] Permeases of the major facilitator superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.133818
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGAATC GCATTGACTG GACAGGAACA CAGCCGCCGA AAGCCACGGA GAAGGGCATC 
TGGGGGTGGA TGTTCTTCGA TTGGGCAGCC CAGCCCTTCT TTACCGTGGT CACGACCTTC 
ATCTTCGGTC CCTATTTCGT TTCCCGTCTG ACCGATGACC CGGTTTCCGC GCAGACGACG 
TGGAGCAACA TGGCGACGAT CTCCTCGGTG ATCATCGCCC TGCTTTCGCC CATCCTCGGC 
TCGATCGCCG ACCAGTCGGG CGCGCGCAAA CCCTGGATCG GCTTTTTTGC GATCATCAAG 
ATCGTCAGCC TGTTCTGCCT GTGGTTCGCA GCCCCCGGCT CGCCTGTTCT TTATCCGGTC 
ATTTTCATGA TCCTTGCCTC GATCTCGGCC GAGTTTTCGA TCGTCTTCAA CGATTCGATG 
ATGCCGCGGC TGGTCGCCAA ACACGAGGTC GGCAAGCTCT CCAACACAGC CTGGGGGCTC 
GGTTATCTCG GCGGCATCAT CGTGCTCATT GCCGTCGTGA CGCTTTTGGC GGCGAGCCCG 
GAGAGCGGCA AGACCATCCT CGGCCTCGAT CCGCTCTTCG GTCTCGATCC TCGGACCGGC 
CAGGATGCAC GCATCACCGG GCCGATCTCG GCCGTCTGGT ATCTGATCTT CATCCTGCCG 
ATGTTCTTCT TCACGCCGGA TGTCGACAGA GGTCTTCCGT TCGGCACCGC CGTCCGTGCC 
GGCCTGCGGG AAGTGAAAAA CACGCTTGGC GAACTCAAGG AACGCCGCGG CATCCTGAGA 
TTTCTCATCG CCCGGATGAT CTATCAGGAC GGCGTCAACG GCCTGCTGAT CCTCGGCGGT 
ATCTTCGCCG CCGGCATGTT CGGCTGGGCA ACGATCGAGA TCGGCATTTA CGGCATCATC 
CTGAATGTGG TCGCGATCTT CGGCTGCCTG ATCGCCGGCC GCATCGACAA GGGTGTCGGG 
TCGAAGGTGA CCGTCGTCAT CAGCCTCACC ATGCTGCTTC TCGCCACCAT CGGCATCATC 
TCGACAGGGC CGGGTTACAC CCTGTTCGGC CTGCTGCCGC TGCCGACGGC GGATTCTGGC 
GGCCTCTTCG GCACCGCGGC GGAAAAAGCC TATATCCTCT ACGGCCTGCT GATCGGGTTC 
GCCTTCGGGC CGGTGCAGGC CTCGTCGCGC TCCTATCTCG CCCGCAGCGT CAGCCCTGAG 
GAAGCCGGCC GCTACTTCGG CATCTACGCG CTTTCGGGGC GCGCCACGAG TTTCATGGCG 
ACGCTCCTTT TCTCGCTCAT GACCTATATG AGCGGGTCAC CGCGGCTTGG AATGGCCACA 
CTGATCCTGT TTCTCGCCGG TGGCCTGGTG CTGCTCGTCC GCACGCCCTA TCCGGCCGAT 
CGCGCGTAG

Protein sequence

MLNRIDWTGT QPPKATEKGI WGWMFFDWAA QPFFTVVTTF IFGPYFVSRL TDDPVSAQTT 
WSNMATISSV IIALLSPILG SIADQSGARK PWIGFFAIIK IVSLFCLWFA APGSPVLYPV 
IFMILASISA EFSIVFNDSM MPRLVAKHEV GKLSNTAWGL GYLGGIIVLI AVVTLLAASP 
ESGKTILGLD PLFGLDPRTG QDARITGPIS AVWYLIFILP MFFFTPDVDR GLPFGTAVRA 
GLREVKNTLG ELKERRGILR FLIARMIYQD GVNGLLILGG IFAAGMFGWA TIEIGIYGII 
LNVVAIFGCL IAGRIDKGVG SKVTVVISLT MLLLATIGII STGPGYTLFG LLPLPTADSG 
GLFGTAAEKA YILYGLLIGF AFGPVQASSR SYLARSVSPE EAGRYFGIYA LSGRATSFMA 
TLLFSLMTYM SGSPRLGMAT LILFLAGGLV LLVRTPYPAD RA