Gene Smed_0801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0801
Symbol
ID	5321638
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	861962
End bp	863197
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	61%
IMG OID	640789738
Product	major facilitator transporter
Protein accession	YP_001326492
Protein GI	150396025
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.419426
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCAGA TCCGCCCGCT CATCCCGCTG CTCGTCACCG CAGGCATACT GATCGGCGGC 
AACGGGCTGC AGGGCACCTT CATTTCATTG AGAGCGCTGG ACGAGGGGTT CTCGACCTCG 
CTCATCGGCG TGGTCGGCGC CGGCTACAAT ATCGGGTTCG CGATCGGCTG CATCTACGTC 
ACCCGCATCC TCCGCGCGAT CGGTCACATC CGCACCTTTT CGGCAATGGC GGCCATAGCC 
TCGGCTGCCG CGATCTCCAT GGTTCTCATT ATCGATCCCT GGTTCTGGTT CCTGATGCGA 
CTCGTCGCCG GGATCTGCTT CGCAAGCCTC TTCGCCACGG TGGAGAGCTG GTTGAATGCC 
AGCGTCACCA ACGCCAACAG GGGACGCACA TTGTCGGTCT ACCGTCTGGT CGATCTCGGT 
TCGGTCACAG CGGCGCAATA CGCCATACCC GGCATCGGCA TCGGCGGGTT TGAGCTCTTT 
GCGATCATTT CCATGGCGCT GACGCTCTCG CTCGTGCCGA TTTCCTTCGC CGACAGATCG 
AGCCCGGTCA CTCCGGAAGC GATCCGATTC GACGTCAAGA CGCTCTGGAA CATCTCGCCG 
CTGGCCACCA TTGGCTGCAT CGTCGTGGGC CTGACCAATG CCGCATTCCG CTCGCTCGGC 
CCGATCTATG CGCAGGAGAT CGGGCTTTCG GTAACGGCAA TCGCGACCTT CATGAGCGCG 
GGCATCATCG GCGGCGTCGT GTTGCAATAT CCCCTAGGCT ACTACTCCGA CCGGATCGAC 
CGCAGGCTGA TCATCCTGCT CGCAACCTTC GGCTCCCTGC TTGCGGGCCT CTTCCTCGCC 
TTCGGCGCCG GCAGCGACGA GTGGCTGAAC TTCGCCGGTA TCTTTGCCTT CGGCGCCTTC 
GCTATGCCGC TATTTTCGCT ATGCTCGGCA CAAGCCAACG ACCATGCGGC TGAAGGCCAG 
CATGCGCTGG TTTCGGCAGG CATGCTCTTC TTCTGGTCGC TCGGAGCTAT TATCGGGCCG 
CTCTTCGCAT CCTTCCTGCT CGAGATATTC GCCCCGCAGG TGCTTTTCAT CTACACGGCC 
GCGATCCTGG GGGCTTTCAT GCTCTACACA CTCTTGCGCA TGACTGCGCG TAAGCCGGTT 
CCAACCGAGG AACGGTCGAT GCGCTTTCGC AATCTCCTTC GCACATCGTC CTTCTTCAAC 
AAGCTTGCCG GCGGCCACGC GCGAAAAGAG CCGTGA

Protein sequence

MSQIRPLIPL LVTAGILIGG NGLQGTFISL RALDEGFSTS LIGVVGAGYN IGFAIGCIYV 
TRILRAIGHI RTFSAMAAIA SAAAISMVLI IDPWFWFLMR LVAGICFASL FATVESWLNA 
SVTNANRGRT LSVYRLVDLG SVTAAQYAIP GIGIGGFELF AIISMALTLS LVPISFADRS 
SPVTPEAIRF DVKTLWNISP LATIGCIVVG LTNAAFRSLG PIYAQEIGLS VTAIATFMSA 
GIIGGVVLQY PLGYYSDRID RRLIILLATF GSLLAGLFLA FGAGSDEWLN FAGIFAFGAF 
AMPLFSLCSA QANDHAAEGQ HALVSAGMLF FWSLGAIIGP LFASFLLEIF APQVLFIYTA 
AILGAFMLYT LLRMTARKPV PTEERSMRFR NLLRTSSFFN KLAGGHARKE P