Gene Smed_3859 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3859
Symbol
ID	5318296
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	315667
End bp	316875
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	63%
IMG OID	640775671
Product	major facilitator transporter
Protein accession	YP_001312604
Protein GI	150376008
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.526422
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAGTT CGCATTATCG CTGGGTGATC GTTGCTGCAG GCGGCCTGCT GGGGTGTATT 
GCAATCGGTG CCATGTTTTC CTTGCCGGTT TTCCTCGTCC CCATCTCGCG CGATACCGGA 
TGGTCGGTGA CCGGCATCTC GAGCGCCATG ACCGTGGGTT TCCTTGCCAT GGCGCTCGCA 
AGCATGGTCT GGGGTAGCGC CTCGGATCGC TGGGGGCCGC GCCCGGTCGT GCTCATCGGA 
TCGGCGCTCC TTGCTTCCAG CCTGGCTCTT TCGAGTTTCG TGACCTCGCT CATCGCATTT 
CAGCTCATCT TCGGCGTTTT CGTCGGCGGT GCCTGCGCGG CGATATTCGC GCCGATGATG 
GCTTGCGTTA CGGGCTGGTT CGATACGCAT CGGAGCCTTG CCGTATCGCT GGTATCGGCC 
GGCATGGGGA TGGCGCCCAT GACCATGTCT CCGCTGGCCG GCTGGCTGAT AACGATCTAC 
GACTGGCGCA CATCGCTGCA GATCATAGCC GCCATTGCCG CCGTCACGAT GATTCCAGCC 
GCGATGCTGC TGCGTCGCCC GCCGGTCCTG GAAGATCCGA ATGCCGGCCC TGCAAGCGAG 
GGACAACCGG ACATGTCGCT TGGCCAGGCC TTGCGATCGC CGCAATTCGT CATCTTGCTG 
CTGACGAACT TCTTCTGCTG CGCCACCCAT TCGGGCCCGA TTTTCCACAC CGTGAGCTAT 
GCCGTGAGCT GCGGTATCCC GATGATGGCC GCGGTTTCCA TCTACAGCCT CGAGGGGCTG 
GCGGGGATGG GCGGCCGTGT TGCCTTCGGC ATCCTCGGAG ACCGCTACGG CGCGAAGCGT 
ATTCTCGTAT CGGGTCTGCT GCTGCAGGCT TTCGGCGCGC TCGCCTATTT CTTCGTGCGC 
GACCTCGGCG CTTTTTATGC AGTGGCTGCC TTGTTCGGCT TTATCTATGC AGGCGTCATG 
CCGCTTTACG CGGTGATCGC CCGAGAAAAC TTCCCGCTGC GTATGATGGG CACCGTAATC 
GGCGGCACGG CAATGGCCGG CAGCCTCGGC ATGGCGATCG GCCCGGTTGC CGGAGGCGTG 
ATCTACGATG TTTTCGCCAG CTACGGTTGG CTCTATATCG GCGCCTGGGG CATCGGCATC 
GGTGCTTTCC TGATCGCGCT GACCTTCAAG CCTTTCCCCA AACGACGGCC GGCAGCGGCG 
GCCGCTTGA

Protein sequence

MISSHYRWVI VAAGGLLGCI AIGAMFSLPV FLVPISRDTG WSVTGISSAM TVGFLAMALA 
SMVWGSASDR WGPRPVVLIG SALLASSLAL SSFVTSLIAF QLIFGVFVGG ACAAIFAPMM 
ACVTGWFDTH RSLAVSLVSA GMGMAPMTMS PLAGWLITIY DWRTSLQIIA AIAAVTMIPA 
AMLLRRPPVL EDPNAGPASE GQPDMSLGQA LRSPQFVILL LTNFFCCATH SGPIFHTVSY 
AVSCGIPMMA AVSIYSLEGL AGMGGRVAFG ILGDRYGAKR ILVSGLLLQA FGALAYFFVR 
DLGAFYAVAA LFGFIYAGVM PLYAVIAREN FPLRMMGTVI GGTAMAGSLG MAIGPVAGGV 
IYDVFASYGW LYIGAWGIGI GAFLIALTFK PFPKRRPAAA AA