Gene Rleg2_6133 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_6133
Symbol
ID	6983206
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011370
Strand	-
Start bp	66767
End bp	68425
Gene Length	1659 bp
Protein Length	552 aa
Translation table	11
GC content	59%
IMG OID	643399152
Product	major facilitator superfamily MFS_1
Protein accession	YP_002283908
Protein GI	209551992
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.376404
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.0270764
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACATG TCGAAACCAT GACTCAGGCT CAGGGGATAT CCCGCAGAGA CAGGAAGGTT 
ATCCTTGCAG CTTCTCTGGG GACGGTTTTT GAGTTTTACG ACTTCTTTCT AATCGGACTT 
GTCGCCACCG AAATCGCCAA GGCGTTTTTC TCGGGCGTCA ATCCGACAGC GGGCTTCATC 
TTCACCCTCT TGGGTTTCGC CGCTGGCTTC ATGCTGAGGC CATTCGGCGC GATTGTGTTC 
GGACGTCTCG GCGACCTGGT GGGCCGGAAG TACACGTTCC TCGTCACGAT CGTTCTCATG 
GGCGGCTCGA CGTTCCTGAT CGGGCTTCTG CCGGCTTACG CGACGATCGG GGTGGCGGCG 
CCAATCGCAT TCGTCGCCAT GAGAATGCTT CAGGGCCTGG CGCTCGGAGG CGAGTTCGGG 
GGCGCCATGG TGTACGTGGC GGAACATGCT CCTTCGGATA GACGTGCGAC CTATACTGCC 
TGGATCATCA TGACGGCGGC GATCGGCTTC CTGCTCGCGG TAGCGGTAAT CATCCCTCTC 
CGCTTGGCTT TGGGAGCGGA CGCGTTCGCA CTCTGGGGAT GGCGCGTTCC GTTCATTATC 
TCGATCGTTC TGCTGGGCGT GTCCCTGTGG ATCAGACTTA GGCTCGACGA ATCGCCCGAG 
TTCAAGCGGA TGAAGGCGGA GGGCAAGGCT TCGAAGTCTC CTCTGGCGGA GACCTTCGGA 
ACCTGGAGAT ACGTCAAGGT CATCATTGTC GCGGCCCTCT GCATCCTGCC GGCTCAGGCA 
GTGATCTGGT ATACGGGACA ATTCTACACG CTGTTCTTCC TTACCAAGGT CCTCAAGGTT 
GAGAACCTTT CCGCAAACAT GATGCTCATC ATCGCCACCG TGTTAACCGC GCCCCTATAC 
GTCGTTTTCG GAAAACTCTC CGATAGGATT GGACGTAAAC CTGTTTACAT CGCGGGTTAC 
CTCCTCGCAG CTCTGGTAAC CATCCCGACA TTCCACGGAC TGACGCACTT TGCCAATCCT 
GCATTGGAAC GTGCGCAGGC GAACACTCCG ATCACGATTG TTGCTGATCC CAATGACTGC 
TCGTTCCAGT TCAATCCCCT CGGGACGTCG AAATTCACTA CCTCATGCGA CGTTGGTATC 
AACGCTGTCG CGAACCTCGG CTTGAACTAT CAAAGCCAGG ACGCCGCCGC GGGGACGGTT 
GCATCGGTTA AGGTGGGAGA CCGCGTCATC GCGAGCTACG CCGCCGATGC TGCGGATGCG 
GCTTCTCAGA AGACGAGATT GGAAGCGGAA CTGAAGCAGG CCCTGGCAGA GGCTGGGTAC 
CCGGTTGGAA GCGCCGACCC CGAAAGTGTG AACAGCCCTG CGATCATAGC GTTGCTTTGC 
GTGCTTCTGG CGCTCGGCGC CATGGTTTTC GCGCCGACGA CGACCTCGCT ACTTGAGATG 
TTCCCTTCCC GGATTCGGTA TACGGCGATG TCCTTCCCCT ACCATCTCAG CGCGGCGTGG 
TTCGGCGGCT TCCTGCCAGC AACGGCGTTT GCGATCGTCG CTGCCACCGG CAACGTGTAC 
TCGGGGCTTT ATTACCCGGT TAGCATCGCG GCGGCCTGCA TGGTCTTGAG CCTGCTCTTC 
GCACGGGAGA CGCGCGGGAC GGACATCTCC AAGGGCTGA

Protein sequence

MTHVETMTQA QGISRRDRKV ILAASLGTVF EFYDFFLIGL VATEIAKAFF SGVNPTAGFI 
FTLLGFAAGF MLRPFGAIVF GRLGDLVGRK YTFLVTIVLM GGSTFLIGLL PAYATIGVAA 
PIAFVAMRML QGLALGGEFG GAMVYVAEHA PSDRRATYTA WIIMTAAIGF LLAVAVIIPL 
RLALGADAFA LWGWRVPFII SIVLLGVSLW IRLRLDESPE FKRMKAEGKA SKSPLAETFG 
TWRYVKVIIV AALCILPAQA VIWYTGQFYT LFFLTKVLKV ENLSANMMLI IATVLTAPLY 
VVFGKLSDRI GRKPVYIAGY LLAALVTIPT FHGLTHFANP ALERAQANTP ITIVADPNDC 
SFQFNPLGTS KFTTSCDVGI NAVANLGLNY QSQDAAAGTV ASVKVGDRVI ASYAADAADA 
ASQKTRLEAE LKQALAEAGY PVGSADPESV NSPAIIALLC VLLALGAMVF APTTTSLLEM 
FPSRIRYTAM SFPYHLSAAW FGGFLPATAF AIVAATGNVY SGLYYPVSIA AACMVLSLLF 
ARETRGTDIS KG