Gene Rleg_4238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4238
Symbol
ID	8015021
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	4337631
End bp	4339019
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	61%
IMG OID	644826808
Product	major facilitator superfamily MFS_1
Protein accession	YP_002978017
Protein GI	241206921
COG category	[R] General function prediction only
COG ID	[COG2270] Permeases of the major facilitator superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.239966
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGAATC GCATTGACTG GACAGGAACG CAACCGCCGA AGGCCACGGA GAAGGGCATC 
TGGGGGTGGA TGTTCTTCGA CTGGGCAGCA CAGCCCTTCT TTACCGTGGT CACAACCTTT 
ATCTTCGGCC CCTATTTCGT TTCCCGCCTG ACCGATGACC CGGTTTCCGC GCAGACGACG 
TGGAGCAACA TGGCGACGAT CTCCTCTGTG ATCATCGCCC TGCTCTCACC CGTTCTCGGT 
TCGATCGCCG ACCAGTCCGG CGCACGCAAA CCTTGGATCG GCTTCTTCGC GATCATCAAG 
ATCGCCAGCC TCTCCTGCCT GTGGTTTGCC GCACCCGGTT CGCCTATTGT CTATCCCGTC 
ATTTTCATGA TCCTCGCCTC GATCTCGGCC GAGTTTTCGA TCGTCTTCAA TGATTCGATG 
ATGCCGCGCC TGGTCAGCAA GCACGAAGTC GGCAAGCTTT CCAACACCGC CTGGGGGCTC 
GGTTACCTCG GCGGCATCAT TGTGCTCATT GCCGTCGTGA CGCTTTTGGC GGCGAGCCCC 
GAGACCGGCA AGACCATCCT CGGTCTCGAT CCGCTATTCG GCCTCGATCC TCAGACCGGT 
CAGGATGCAC GCATCACCGG GCCGATCTCG GCCGTCTGGT ATCTGATCTT CATCCTGCCG 
ATGTTCTTCT TTACGCCGGA TGTCGGCAGG GGTCTTCCCT TCGGCACCGC CGTCCGCTCC 
GGCTTGCGGG AACTCAGAAA CACGCTTGGC GAACTCAGAG AACGCCGCGG CATCCTGACA 
TTCCTCATCG CCCGCATGAT TTATCAGGAC GGCGTCAACG GCCTGCTGAT CCTTGGCGGT 
ATCTTCGCGG CCGGCATGTT CGGCTGGGCG ACGATCGAGA TCGGTATCTA CGGCATCATC 
CTGAATGTTG TCGCGATCTT CGGCTGCCTG ATCGCCGGCC GCGTCGACAA GAGCGTCGGT 
TCGAAGGTGA CCGTCGTCAT CAGCCTCACC ATGCTGCTTC TCGCCACCAT CGGCATCATC 
TCGACAGGAC CGGGTTACAC CCTATTCGGA CTGATGCCAC TGCCGACGGC CGATTCCGGC 
GGCCTTTTCG GTACTGCCGC GGAAAAGGCC TATATCCTCT ATGGTTTGCT GATCGGGCTC 
GCCTTCGGGC CGGTGCAGGC CTCGTCGCGC TCCTATCTCG CCCGCAGCGT CAGCCCGGAG 
GAAGCCGGCC GCTACTTCGG CATCTACGCG CTTTCGGGCC GCGCCACCAG TTTCATGGCG 
ACGCTGCTCT TCTCTCTGGT GACTTATATG AGCGGATCAC CGCGGCTCGG GATGGCAACG 
CTGATCCTCT TTCTTGCCGG CGGACTGGTG CTCTTGTTCC GTACACCCTA TCCGGCCGCC 
CGGGCATAG

Protein sequence

MLNRIDWTGT QPPKATEKGI WGWMFFDWAA QPFFTVVTTF IFGPYFVSRL TDDPVSAQTT 
WSNMATISSV IIALLSPVLG SIADQSGARK PWIGFFAIIK IASLSCLWFA APGSPIVYPV 
IFMILASISA EFSIVFNDSM MPRLVSKHEV GKLSNTAWGL GYLGGIIVLI AVVTLLAASP 
ETGKTILGLD PLFGLDPQTG QDARITGPIS AVWYLIFILP MFFFTPDVGR GLPFGTAVRS 
GLRELRNTLG ELRERRGILT FLIARMIYQD GVNGLLILGG IFAAGMFGWA TIEIGIYGII 
LNVVAIFGCL IAGRVDKSVG SKVTVVISLT MLLLATIGII STGPGYTLFG LMPLPTADSG 
GLFGTAAEKA YILYGLLIGL AFGPVQASSR SYLARSVSPE EAGRYFGIYA LSGRATSFMA 
TLLFSLVTYM SGSPRLGMAT LILFLAGGLV LLFRTPYPAA RA