Gene Rleg_6620 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_6620
Symbol
ID	8022870
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012858
Strand	-
Start bp	49640
End bp	50839
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	61%
IMG OID	644833489
Product	major facilitator superfamily MFS_1
Protein accession	YP_002984623
Protein GI	241666539
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.397819
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.21382
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCGAC TTTTCCCTGA CGTCTTCCGC AATCCGGCGA TCCGCGCCAG CATGATCGCC 
ATTTTCATCT TCGGCATGGC GGGAGCGATG ACCGCACCCT ACCGTTCGAT CATCGGCATC 
CGCGAATTGG GGCTGAGCGA CGGCCTCTAT TCCTTCCTGA GTTTCGTCTC GGCGGCGGTG 
AATGTCGTCA TCAGCATCCT GCTCGGCAAT CTCGCCGACC GGCTTGGTGA ATACCGTTCG 
ACGATGATCG GCGCCTGCCT GTTCGGCATC GTCGGCTACG GCGTGGTCTA CGCCTTTCCC 
AGCGCCGCCG TCTTCGTCAT CAGCGGGTTG CTGCCCCTGC CGATCTACGG GGCGCTGAAC 
TCGCTGCTGT TTGCCAATGC GCGCGCGGCT ATGCACGGCA TGAACCGAAG CGACATGGTG 
ACGGCCAACT CCGGCGTGCG CGCCATGATC TCGCTGTCGT GGGTACTGAT CCCAGGGATA 
ACTGGCCTGC TGCTGTCTGG CGCATCGAGC ATGCTGCCGG CCTACCTCTT TGCCAGCATC 
TCATGTCTGT TGTGCCAGGG GATCATCCTC TTCGCCTTGC CGAAGCGAGC GGCAACGGAA 
ATGGCAGCAG TTCATCATCT CACTTACCTC GGCGCGCTTG GCCAAGTGGT TTCTCCGCGG 
ATTTCGGCGC ATATTTGCGG GGTCGCGCTG ATCACCAGTA CGCTGCATCT GAATGACGCC 
CTGCTGCCAT TGATCGCCAC TGGTGCTGCG CATGGCAAGC TGAGCGACGT CGGCATTCTC 
GTCGGCATCG TCGCATTGCT GGAAGTCGTC TTCATCATCG TCTGGTCGCG GATCGCGCGG 
AAGACAGGAC AGATGACGGC GCTTGGCGCC GGTACCATCA TCTATGCCGT CTTCCTCAGT 
CTGCTTGGCT TTGCCTCCGA GCCGTGGCAC CTCTATGCGC TCACCTTGCT TGCCGGCATC 
GGAGCGTCGG CGATCATCAC CATTCCGATC ACCTATCTGC AGGATCTGAT CGCCGACCGG 
CCGGGCCTCG GCAGCGCACT GATCTCCGTC AATATCTTTG CCAGTGCCGG GATCGGCGCG 
CTGGTCTTTG CCGCCGGCAC CTATGTGACC GGCTATTCGG GAACCGCAAT CCTCAGCGCT 
GTCACCGGAT TGGCGGGGAT AGCGATCATC GGCCTCCTGC GTAGAGGCAA AGCCCGCTAG

Protein sequence

MSRLFPDVFR NPAIRASMIA IFIFGMAGAM TAPYRSIIGI RELGLSDGLY SFLSFVSAAV 
NVVISILLGN LADRLGEYRS TMIGACLFGI VGYGVVYAFP SAAVFVISGL LPLPIYGALN 
SLLFANARAA MHGMNRSDMV TANSGVRAMI SLSWVLIPGI TGLLLSGASS MLPAYLFASI 
SCLLCQGIIL FALPKRAATE MAAVHHLTYL GALGQVVSPR ISAHICGVAL ITSTLHLNDA 
LLPLIATGAA HGKLSDVGIL VGIVALLEVV FIIVWSRIAR KTGQMTALGA GTIIYAVFLS 
LLGFASEPWH LYALTLLAGI GASAIITIPI TYLQDLIADR PGLGSALISV NIFASAGIGA 
LVFAAGTYVT GYSGTAILSA VTGLAGIAII GLLRRGKAR