Gene Smed_5332 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5332
Symbol
ID	5319634
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	292690
End bp	293871
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	61%
IMG OID	640777105
Product	major facilitator transporter
Protein accession	YP_001314037
Protein GI	150377442
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.556547
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGTGA ATGCTTCGCC AGCCCTCATG TTCCTGCTGA TCTCGTTCGG AACCATCCTC 
GGAATCGCGG GGACTGATTT GATTCTGCCT GCAATCCCCG CCATGCCGGC CGCACTCGGC 
GGGACTGCGG CATTGGCGCA GATGGTGCTC GCAGCCTATG CCGCAGGGAC GCTCGTGGGA 
TTGCTGACCT TCGGCGAACT CGGGGCGAGA TACTCTCGCC GCACGCTGTT GGTCTGGTCG 
CTAAGTCTGT TTGCCGTCAC CTCTCTTCTG TCTGCCTATG CGCCGACGTT GGAATGGCTG 
GTCATCCTGC GTTTCGCGCA AGGCGCCTTC GGCTCGGCCC CGGCGGTTTT CGCGCCCGGC 
TTTATTCACG GGCTTTTTCC CGGCGACAAG GCACCTTCCA TGTTCGGCCG GCTCGGTTCC 
ATAGAGTCCC TGACGCCGGC TCTTGCCCCC ATCGCCGGAG CCTATCTTAT GACCGTTGCG 
GGATGGCAGA CCTCCTTCAT TATGCTGGCG GGATTTGCGG TTCTTTGCGC CGCCGGCAGT 
TGGGCTTACC GTCAGTCGCT TCCGGACCGG GCCGAGGCTC GTGATATACA TCAGAGCTAT 
GGGTCGATCC TTCGCAATGG CGATTTTCTT CGGCACGGTT TAAGTCAGGC GCTTTCCCTC 
GGCAGCATTC TCACCTTTGT CTTCGGGGCC CCCGCCGTGA TGACAGGGGC GTTGGGCATG 
ACGATCGGAA GCTTCATTCT CCTCCAGGTC TGCGGCATTG CCTTTTTCAT TCTGGCATCG 
AACGCGTCCA ATGCACTTGC CCGAAGATTC GGTACCGAAC GCATGATCAT GGTTGGTACA 
GGAGGCCTGG TTCTCGGCTT CTTGCTGATT CTTCACTACA CATCTCTTGG CGGACGCAGT 
CTGGCCGTGC TCGTGCCCCT GTGGATGACC GCAAACGGCG CGTTCGGCAT CCGGGGGCCG 
ATAGGTTTCC ACCAGGCGAT CGTAGCCTCC AGGGGCGATC ATTCACGCGG CGCCGCATTG 
GTCGTTGCCG CTATACTCGG GATCACTGCC GGAGGTACGG CCGCCGCGGC GCCTTTCATC 
AACATAGGCT GGTGGCCGCT TGCCCTTGCC AGCAGCCTCG CTGCGATATT GGCTTTGCTA 
TGTCTGACGC TGATCGGCAG CACGGCGAAA GAGGATGGTT AG

Protein sequence

MIVNASPALM FLLISFGTIL GIAGTDLILP AIPAMPAALG GTAALAQMVL AAYAAGTLVG 
LLTFGELGAR YSRRTLLVWS LSLFAVTSLL SAYAPTLEWL VILRFAQGAF GSAPAVFAPG 
FIHGLFPGDK APSMFGRLGS IESLTPALAP IAGAYLMTVA GWQTSFIMLA GFAVLCAAGS 
WAYRQSLPDR AEARDIHQSY GSILRNGDFL RHGLSQALSL GSILTFVFGA PAVMTGALGM 
TIGSFILLQV CGIAFFILAS NASNALARRF GTERMIMVGT GGLVLGFLLI LHYTSLGGRS 
LAVLVPLWMT ANGAFGIRGP IGFHQAIVAS RGDHSRGAAL VVAAILGITA GGTAAAAPFI 
NIGWWPLALA SSLAAILALL CLTLIGSTAK EDG