Gene Rleg_4160 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4160
Symbol
ID	8014952
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	4245362
End bp	4246552
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	62%
IMG OID	644826730
Product	major facilitator superfamily MFS_1
Protein accession	YP_002977940
Protein GI	241206844
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0738] Fucose permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATAGTC ATGTGAGTGC GCCGGGAGCC CGGAGCGGCT TCATTACCAG AAGCAGGGCG 
GCGGTTTCCC TGCTCTTTCT TATGAATGGT TTTGTCGTCG GCTGCTGGGC GCCGAAGATC 
CCGGATTTTG CCGAGCGTCT GGCGCTGACC AAGTTCGAGC TTGGGCTGAT GATCCTCGTC 
TTCGGCGTCG GCTCGCTGGT CATGATGCCG ATCGCCGGTG CGCAGATCGC CAAACACGGC 
TCGCGTGTCG TCGTTCAGGT CCTGGCCGTC TCTGTGCTGC CGTTGCTGCT GGCATTGACG 
CTGGCGCCAA ATGTGCTGAC CGGGGCAATC TCGCTCTTCC TGTTCGGCGG CTTCATCGGC 
GCAATGGATG TGGCGATGAA TGCCAATGCA GTGTCGGTCG AGAAATCCAT GCGCCGCGCC 
ATCATGTCGT CCTGCCACGC TTTCTGGAGC CTTGGCGGAC TGATCGGCTC AGGTCTCGGC 
GGCATCGTGA TCTCCAAGCT CGGTATTCTC GGCCATGCGC AACTGGCGAC GGTGCTGGCG 
GCGATCTTCC TTGCCGTCGC CTGGCCGATG ATCCTTGCGG ATCCGCCGCA TCCCGACGCC 
AAGAAGGAAA AGACGAAGCT GCCGATGGTA CCGCTGCCGT GGCTGCTCGG ATTGATGGCG 
CTGTTCAGCA TGGTGCCTGA AGGCGCTGTT CTCGACTGGG GCGCGCTCTA TCTCCGGCAG 
GAAATGGGTG CATCCGTGGC GCTTTCCGGC CTTGGTTTCG CAGCCTTTTC GGCGACCATG 
GCAATCATGC GCTTTGCCGG CGACCTGGTG CGCGACCGCC TGGGCGGCGT CAAGACGCTA 
CGCATCTGCA CTTTGTTTGC CATTGTCGGC ATGCTGCTTG CCGGCCTGGC GCCCAATGCC 
GAGCTTGCCA TCCTGGGCTT TGCGTTTTGC GGTATCGGCA TTTCCAACAT GGTGCCGATC 
GCTTTCTCGG CGGCGGGCAA TATTCCCGGA CTCAAGCCCG GCATCGGCAT CTCGGTGGTC 
ACGACCATGG GCTATTCCGG CATGCTGGTT GCGCCATCGT TGATCGGCTT CGTCGCCGAG 
CATATCGGTT TTGCCGTCGT TTTCATGGCG CTGCCGGTGC TGCTCATCGT CGTTCTGCTG 
CTCTCCAACC TGGCCCATTA TGCCGATGAG ACCTCCGGAG GCGGTCACTG A

Protein sequence

MDSHVSAPGA RSGFITRSRA AVSLLFLMNG FVVGCWAPKI PDFAERLALT KFELGLMILV 
FGVGSLVMMP IAGAQIAKHG SRVVVQVLAV SVLPLLLALT LAPNVLTGAI SLFLFGGFIG 
AMDVAMNANA VSVEKSMRRA IMSSCHAFWS LGGLIGSGLG GIVISKLGIL GHAQLATVLA 
AIFLAVAWPM ILADPPHPDA KKEKTKLPMV PLPWLLGLMA LFSMVPEGAV LDWGALYLRQ 
EMGASVALSG LGFAAFSATM AIMRFAGDLV RDRLGGVKTL RICTLFAIVG MLLAGLAPNA 
ELAILGFAFC GIGISNMVPI AFSAAGNIPG LKPGIGISVV TTMGYSGMLV APSLIGFVAE 
HIGFAVVFMA LPVLLIVVLL LSNLAHYADE TSGGGH