Gene Smed_1547 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1547
Symbol
ID	5322405
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	1639842
End bp	1641026
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	63%
IMG OID	640790492
Product	major facilitator transporter
Protein accession	YP_001327224
Protein GI	150396757
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.197507
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGTTT TCCGGTCCGT CCTCGTCCTC TCCATCACTC AAATCATCGC CTGGGGAGCG 
ATGTTCATGT TCGTCTCGGT GACGGCGGCC GGGATGGCCG ATGATCTTCT ACTGCGACCT 
TCGACCATCT ATCTCGGCCC GACGGTCATG CTGGTCGCGA TGGCCCTCTG TTCGCCGGTG 
ATGGCGCCGA TCTACGCTCG CTGGGGTGCA AGGCTCGTGC TCGCATTCGG TTCGGCGGCT 
GCAGCTCCCG GGCTGTGGTT GCTTGCCGGC GCCGAAGGCC CGGTTTCCTA TTTTTCAGCC 
TGGGCCATCC TGGGTCTGGC CGGAGCGGCG GCACTTACGA CTTCGGCTCA GGTGTTTTTG 
ACGGAGATAG CGGGGGAGCG TGCCCGCCGG GCAATCGGCG CACAGATGCT CGCCATGGCG 
CTTGCACCGA CGATCGCATG GCCAGTCACA ACCATCTGCG AAGCGACTTT CGGCTGGCGC 
GGCACATTCG TTCTCTATGG CGCTGTGATG CTGCTCGTCT GCACGCCTTT TCACCTCTTC 
GGATTGCCGA GAACCGAGCC GGTAAAGCGC AACTCTTCGG TATCGAATTT CAAGCGCTTT 
AGCGCGTCGG AACTGGCGCG CCGCTGGCGC ATCGTTGCCC TGATCACGGC GGCAGTCGCG 
CTCAACGGCT TTGTCACCTG GGGCTTCCAG CTCGTCGTGA TAGACCTTTT TCGCAGCTTC 
GCCGTGCCTG GTACCCTGGC AGTCGGCTTC GGATCTGCCA TAGGCTTCCT CCAGCTTTCG 
GCGCGCCTGT TCGATTTTCT CGGCGGCAAT CGCTGGGACG GATTGACGAC GGGATTGGTA 
GCCGCGGCGA TGATGCCGCC GGCATTGCTG GTGCTGGCGC TGGGCGAGGG GGCGGAATGG 
TCCATCGTGC TTTTCCTCGT GCTCTACGGC CTTTCAAGCG GAGCAATGTC TGTCAGCCGG 
GCGACGATGC CGTTGGTCTT CTTCTCGTCG GCGGAATACG GGACGGTCGT GGCGCGCCTC 
GGCCTGCCGC TCAACCTCGC TTTCGCGGCG GCCCCGCCGT TCTTCTCCTT CCTGCTTGGC 
GAGGCAGGCA ACAGGTGGGC GCTGACCTTC GCGCTTCTCT GCTCCCTCGG TGCATTGGCC 
AGCATGGCTC TGCTCGCGCG CATGAGGCCT GCGAAGTCGG GTTAG

Protein sequence

MPVFRSVLVL SITQIIAWGA MFMFVSVTAA GMADDLLLRP STIYLGPTVM LVAMALCSPV 
MAPIYARWGA RLVLAFGSAA AAPGLWLLAG AEGPVSYFSA WAILGLAGAA ALTTSAQVFL 
TEIAGERARR AIGAQMLAMA LAPTIAWPVT TICEATFGWR GTFVLYGAVM LLVCTPFHLF 
GLPRTEPVKR NSSVSNFKRF SASELARRWR IVALITAAVA LNGFVTWGFQ LVVIDLFRSF 
AVPGTLAVGF GSAIGFLQLS ARLFDFLGGN RWDGLTTGLV AAAMMPPALL VLALGEGAEW 
SIVLFLVLYG LSSGAMSVSR ATMPLVFFSS AEYGTVVARL GLPLNLAFAA APPFFSFLLG 
EAGNRWALTF ALLCSLGALA SMALLARMRP AKSG