Gene Rleg_2214 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_2214
Symbol
ID	8013223
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	2217275
End bp	2218864
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	64%
IMG OID	644824800
Product	major facilitator superfamily MFS_1
Protein accession	YP_002976030
Protein GI	241204934
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.146904
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGCAAG ACGTCACCGC GCACCCCCTC TATCCAGCAG CGAACAGACA GCCGCCCCGC 
GTCGGTTTGA AGCGGCTTGG CAAGCCTCTT CACCCCATCG TTCCTATGGC CTTATCGCCA 
CCGAAGGCGT ATGGACTGAG ACAGTCCATC GCAGCATCCC GGTTGCCCGT GCCCCGCCTC 
ACACCCATGA TCCTTGCCGT CGCCCTGTTC ATGGAACAGA TGGATTCGAC CGTGATCGCC 
ACCAGCCTGC CGGCAATCGC CGCCGATATC GGCACCTCGC CGATCGCGCT GAAGCTCGCC 
GTCACCAGCT ATCTCGTGGC GCTGGCGATC TTCATCCCGA TCAGCGGCTG GATGTCCGAT 
CGTTTCGGTG CGCGCAACAT CTTCCGCATG GCGATCTTCG TCTTCATGAT CGGCTCGATC 
GCCTGCGCCT TTTCAAACTC GATCACGGCC TTCGTCATCT CGCGCCTGAT TCAGGGCGCC 
GGCGGCTCGA TGATGACGCC GGTCAGCCGC TTGCTGCTGG TCCGGGGAAC ACCGCGCCAC 
GAACTCGTCG ATGCCATGGC CTGGCTCACC ATTCCCGCTC TGATCGGCCC GATCATGGGT 
CCGCCGATCG GCGGCTTCCT CACCACCTAC CTCACCTGGC ACTGGATCTT CTGGATCAAC 
GTCCCGATCG GCGTGCTCGG CATCATCCTC GTCACGCGTT TCCTGCCGGC CGTCGAGCCA 
CGCAGTCCGC GGCCGATGGA CTTCCCGGGC TTTTTCCTTT GCGGCATCGG CTTCTCTGGC 
TTCGTCTTCG GCGTGTCGGT GATCAGCCTG CCGGCCGTGC CCGTCATTTA CGGTTATGTC 
ACGGTTGCGA TCGGCATCCT TGCCGGCCTC ATCTACCTCC TCCATGCCCG CCGCGCGCCC 
TATCCGCTTC TCGATCCGAA GATGTTCCGT TATCCGATGT TCCGGGCGGC GATCCTCGGC 
GCCTCGAATT TCCGCATGGG GCTCGGCGCC TTGCCCTTCC TGATGCCATT GATGCTGCAG 
CTTGGCTTCG GCCTGACGCC GCTGCAATCG GGCTCGGTCA CCTTCGTCAG CGCGCTCGGC 
TCCATGGGCT CGAAATTCGC CGCCTCGCGC ACCTTCAATG CCTTCGGCTT CCGCACGGTG 
ATCTCGCTTA CCACCTTGCT GGCGGCGATC TTCCTCGGCA TCAACGGTCT GTTCACCGCC 
GAAACGCCGC TGTTCCTGAT CATGGCCTGC CTTCTGATCG GCGGACTGTT CCGCTCAATG 
GCTTTCTCGG GCGTCAACGC CATGGCCTTC GGCGATGTCG ACGACGCCGA CAGCAGCCAG 
GCAACCGCAA TCAATGCCGT TGCCCAGCGT ATCTCCATGG CGATGGGTGT GGCGATCGCC 
GGCGGCATCC TCGAAATCTC CAGCAGCTTT CACGACGGCA GGCTGATAGT CTCCGATTTC 
CACATCGCCT TCTTCAGCGT CTCGGCGATT TCGGCGCTGG CCTGCATCAC CTTCCTGCGC 
CTGCCGCACG ATGCCGGCGC GGAACTGACG GCGCGCGGCC GCAAGCGCCG CCACGCCGAG 
CCCGAAGAGG CCGTGGCGGA AAATAGCTGA

Protein sequence

MEQDVTAHPL YPAANRQPPR VGLKRLGKPL HPIVPMALSP PKAYGLRQSI AASRLPVPRL 
TPMILAVALF MEQMDSTVIA TSLPAIAADI GTSPIALKLA VTSYLVALAI FIPISGWMSD 
RFGARNIFRM AIFVFMIGSI ACAFSNSITA FVISRLIQGA GGSMMTPVSR LLLVRGTPRH 
ELVDAMAWLT IPALIGPIMG PPIGGFLTTY LTWHWIFWIN VPIGVLGIIL VTRFLPAVEP 
RSPRPMDFPG FFLCGIGFSG FVFGVSVISL PAVPVIYGYV TVAIGILAGL IYLLHARRAP 
YPLLDPKMFR YPMFRAAILG ASNFRMGLGA LPFLMPLMLQ LGFGLTPLQS GSVTFVSALG 
SMGSKFAASR TFNAFGFRTV ISLTTLLAAI FLGINGLFTA ETPLFLIMAC LLIGGLFRSM 
AFSGVNAMAF GDVDDADSSQ ATAINAVAQR ISMAMGVAIA GGILEISSSF HDGRLIVSDF 
HIAFFSVSAI SALACITFLR LPHDAGAELT ARGRKRRHAE PEEAVAENS