Gene Rleg2_1174 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_1174
Symbol
ID	6979894
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	1184693
End bp	1185922
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	61%
IMG OID	643395887
Product	major facilitator superfamily MFS_1
Protein accession	YP_002280694
Protein GI	209548777
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.148034
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0846365
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAATC AGGAGGGAAC AGCTGCAGCA GTCATGCCGG CGACATACCG CCGTATTCCG 
GCCGGCATTT GGGCGCTCGG TTTCGTCTCG ATGCTGATGG ACATCTCTTC CGAGATGATC 
CATGCGCTCC TCCCGGTTTA CATGGTCTCG GTGCTTGGCA TCTCCATGTT CGCGGTCGGC 
GTCATCGAAG GCATTGCCGA GGCAACGGCA TCGATAACCA AGGTATTCTC GGGGGCTTTG 
AGCGACTGGC TCGGTAGACG CAAGTTTCTC GCAGCACTAG GTTATGGCCT TGCCGCGGTC 
ACCAAGCCGA TCTTTCCACT CGCCTCTTCT CTCGACTGGC TTATTGCGGC ACGATTTGTC 
GACCGCGTCG GCAAAGGGAT CCGCGGTGCG CCGCGGGATG CACTTGTTGC TGACATCGCT 
CCTCCTGAAC TGCGCGGAGC GAGCTTCGGA CTGCGCCAGT CGCTCGACAC TGTGGGCGCC 
TTTGTCGGCC CCCTCCTGGC GATCGGTCTG ATGTGGCTGA CAGCGGATCA TTTCCAAAGG 
GTGTTGTGGA TTGCGGTCCT TCCCGCCTTC CTGTCTGTCG GTGTGCTGCT GTTCGTCGTC 
AAGGAGCCCG AGCGACCGCG GGAGTTTCGC CACGTGCGCA TGCCGCTCCA CAGGGATGAA 
CTGGGCCGTC TCGGTAGATC CTATTGGTGG GTCGTGGCGG TCGCCGCAGC ATTTACGCTA 
GCCCGTTTCA GCGACGCGTT CCTCATCCTG AAGGCACAGT CGATCGGCCT GCCGATAGCC 
TTGGTGCCGC TTGCGCTGGT CCTTATGAGT CTAGCTTATT CGCTCTCGGC TTATCCCGCC 
GGCATGCTCT CAGACAAAAT GGATCGGTTC ACCATTCTTG CTATCGGTCT CGTGTTGCTT 
GTCTGCGCCG ATCTTACCCT GGCGTTCGCA CAGAGTGTCA TCGGCGCCGG ACTCGGTGTC 
CTCCTCTGGG GTCTGCACAT GGGGTTCACG CAGGGGCTGC TGACGAAGGT GATTGCCGAT 
ACATCGCCTG CTGAACTGCG TGGCACAGCC TTCGGCATGT TCAATCTGAT CACCGGGCTG 
GCTCTGCTGC TTGCCAGTGT CATCGCGGGC ACGCTTTGGG ACCTCGCCGG GCCGCGAGGA 
ACCTTCCTCG CCGGCGCCGG GTTCGCAATG CTGACTATGA TCGGGCTGCT CGTCGTCCGC 
ACGCGACTCT CTACACAGGC CGGTGCCTGA

Protein sequence

MANQEGTAAA VMPATYRRIP AGIWALGFVS MLMDISSEMI HALLPVYMVS VLGISMFAVG 
VIEGIAEATA SITKVFSGAL SDWLGRRKFL AALGYGLAAV TKPIFPLASS LDWLIAARFV 
DRVGKGIRGA PRDALVADIA PPELRGASFG LRQSLDTVGA FVGPLLAIGL MWLTADHFQR 
VLWIAVLPAF LSVGVLLFVV KEPERPREFR HVRMPLHRDE LGRLGRSYWW VVAVAAAFTL 
ARFSDAFLIL KAQSIGLPIA LVPLALVLMS LAYSLSAYPA GMLSDKMDRF TILAIGLVLL 
VCADLTLAFA QSVIGAGLGV LLWGLHMGFT QGLLTKVIAD TSPAELRGTA FGMFNLITGL 
ALLLASVIAG TLWDLAGPRG TFLAGAGFAM LTMIGLLVVR TRLSTQAGA