Gene Rleg_5300 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5300
Symbol
ID	8006937
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	+
Start bp	705453
End bp	706637
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	62%
IMG OID	644822206
Product	major facilitator superfamily MFS_1
Protein accession	YP_002973466
Protein GI	241113631
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATCG CCCCGCAGCA GCGGATCTAT GTCTGCTTCT TTCTCTTCGC TGTGTCGCTG 
GGGGCGCTGC TGTCGAGGAT GCCGGATTTG CAGGTTGCAC TTGGCGTCAA TAAGTCCGAG 
CTTGGGTTGA CCCTGATAGG GGCTGCGATC GGCGCCTTGA TTTCGTTGAC TTTGTCTTCG 
CCCTTGATCG CCCGGCTCGG CGCGCGTACG ACGGCATTCA TTACTGTTCT CGGCACGTCT 
GCGCTGCTAT CTCTGGTGCC GTGGATTGGT GCGGCGCCGG TCGTGTTCTG TGTGCTTTTC 
GTCGAGGGGC TGCTCGCCGG GGCGCTGGAG ATCAATCTCA ATGTTGAGAT CGACCGTATC 
GAAGCGCAGC TAGGACGCGG TGTGATGAAC AGGGCGCATG GTTTCTGGAG CCTCGGCTTC 
TTCGTCACGG CGCTTGTCTC CTCGGTCGTT CGCCAAGCCG GGATTTCGAT GGAACTCCAT 
CTCGCCGTGA CCTTTGTCGC GGTTGTTGTC ATCGGCATCT GGGCGATTTC CGGCATGCGG 
AATGCGCCGG CGCGGATCGC GTTGCATGAA GGCAAGGCAC CGCTGGTGGC GCTTCCCACC 
TGGGGCCTCA TGCCGCTGTG CGTGATCGGC ATCGCGGCCT TTCTCGTCGA AGGCGCCGGG 
ATCGACTGGT CGGCGATCTA TATGCGCGAT GTGTTTTCGG TCGAGCCCTT CATTGGCGGA 
CTGGGATTGA CGCTCTTTAC CTTCTGCATG GCGCTGGCGC GCCTGTTCGT CGATCCGCTG 
GTCGATCGGT TTGGCGCGCG GGCCGTCGCC ACGATGTTGC TTGTTCTTTC GGCGATCGGC 
ATCTGCGCCG TGTCGGGGGC GCCGCATCCC TATGTCGCGC TGGCGGGCTT TGCCTTGATG 
GGCGCCGGCT GCAGCGCGGT CTATCCTCTC GCTGTCTCGG CGGCGGCCCA ACGCACCGAC 
CGCGCGGCGT ATCTCAACGT CGCCGCCCTC GGCCAAATGA GCTTTGTCGT CTTTTTCCTG 
GCGCCGCCGC TGCTCGGTTT CATTGCCGAA CATGCTGGCA TCCGGACATC CTATCTCGTT 
TGCCTTCCCC TTATCATTTA CGCGCTCTTT TCGGCCAAGG CGCTTGCTAC GCGCCGGGCT 
GCCGGCGGCG GTAGCGCTGC GACTGCTCGG AGCGTCAACG GGTAA

Protein sequence

MKIAPQQRIY VCFFLFAVSL GALLSRMPDL QVALGVNKSE LGLTLIGAAI GALISLTLSS 
PLIARLGART TAFITVLGTS ALLSLVPWIG AAPVVFCVLF VEGLLAGALE INLNVEIDRI 
EAQLGRGVMN RAHGFWSLGF FVTALVSSVV RQAGISMELH LAVTFVAVVV IGIWAISGMR 
NAPARIALHE GKAPLVALPT WGLMPLCVIG IAAFLVEGAG IDWSAIYMRD VFSVEPFIGG 
LGLTLFTFCM ALARLFVDPL VDRFGARAVA TMLLVLSAIG ICAVSGAPHP YVALAGFALM 
GAGCSAVYPL AVSAAAQRTD RAAYLNVAAL GQMSFVVFFL APPLLGFIAE HAGIRTSYLV 
CLPLIIYALF SAKALATRRA AGGGSAATAR SVNG