Gene Smed_2079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2079
Symbol
ID	5322938
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	2135064
End bp	2136374
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	63%
IMG OID	640791016
Product	major facilitator superfamily metabolite/H(+) symporter
Protein accession	YP_001327747
Protein GI	150397280
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID	[TIGR00883] metabolite-proton symporter

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.611047
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0017507
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACAGACG CGACAACCTC GCTGTCGCCG CAGGATGGTG CGTTGCATCG ACAGGCCGTG 
AACTCCCCGG CCCGGGTGCT GTTCGCCAGC CTCGTCGGCA CGACGATCGA ATTCTTCGAC 
TTCTATGTCT ATGCGACAGC AGCGGTGATT ATTTTCCCGC ACCTTTTCTT CCCTGCAGCT 
GATCCGACCT CGGCAATGCT GCAGTCCTTG GCGACTTTCT CGATCGCCTT TTTCGCCCGT 
CCCCTTGGCG CCGTGATCTT CGGCCACTTC GGCGACAGGA TCGGCCGCAA GGCGACGCTC 
GTCGCCGCGC TGATGACTAT GGGGATTTCG ACGGTCGTGA TCGGCCTGCT GCCCACCTAC 
GCGACGATTG GCGTCGTGGC GCCGCTTCTC CTTGCGCTCT GCCGCTTCGG CCAGGGCCTG 
GGCCTCGGCG GTGAATGGGG CGGCGCGGTG TTGCTAGCGA CCGAGAATGC GCCGGAAGGC 
AAGCGGAGCT GGTATGCAAT GTTCCCCCAG CTCGGCGCGC CGATCGGCTT CATCCTGTCG 
GCCGGGACCT TCCTCGTGCT CGGCGAGGTC ATGAGCGACG AGGCCTTCCT CGCCTGGGGC 
TGGCGAATTC CCTTCGTCGC CAGCGTGCTG CTCGTGATCG TCGGTCTCTA TGTCCGCCTG 
AAGATTACCG AAACGCCGGA ATTCCAGAAG GCAATCGATA AACGGGAGCG CGTCGAGGTA 
CCGGTGGCGG CGATATTCCG CTCGCATAAG CGAAGCCTCG CGCTCGGCAC CTTCGTGGCA 
CTCGCGACCT TCGTCCTGTT CTATCTGATG ACCGTCTTCT CGCTCTCCTG GGGCACGACG 
AAGCTCGCCT ATTCGCGCGA GCAGTTCCTG CTTGTACAGA TGACCGGCGT CGTTTTTTTC 
GGCCTGATGA TTCCCGTCTC CGGCATTCTT TCGGACCGCT TCGGACGCCG CCTGGTGCTG 
GTGCTCACAA CAATCGGCAT CGGCATATTC GGCCTCGTCA TGGCGCCGCT TCTGACATCC 
GGTCTCGGCG GCGCCTTCGT CTTCTCGATC CTCGGACTCG GCCTGATGGG CCTTACCTAC 
GGGCCGATCG GCGCGGCGCT GGCGGCTCCC TTTCCGACTG CAGTGCGTTA TACCGGCGCC 
TCGATGACCT TCAACCTCGC AGGCATCTTC GGCGCGTCGC TGGCACCCTA CATCGCCACC 
TGGCTCGCGA CCAACTACAG CCTCGGCCAT GTCGGCTATT ATCTGATGGG CGCCGCATTG 
ATCACGCTCG TCTGCCTGCT GCTTTCGAAC GAGGAAGAGG TCTCGGGCTG A

Protein sequence

MTDATTSLSP QDGALHRQAV NSPARVLFAS LVGTTIEFFD FYVYATAAVI IFPHLFFPAA 
DPTSAMLQSL ATFSIAFFAR PLGAVIFGHF GDRIGRKATL VAALMTMGIS TVVIGLLPTY 
ATIGVVAPLL LALCRFGQGL GLGGEWGGAV LLATENAPEG KRSWYAMFPQ LGAPIGFILS 
AGTFLVLGEV MSDEAFLAWG WRIPFVASVL LVIVGLYVRL KITETPEFQK AIDKRERVEV 
PVAAIFRSHK RSLALGTFVA LATFVLFYLM TVFSLSWGTT KLAYSREQFL LVQMTGVVFF 
GLMIPVSGIL SDRFGRRLVL VLTTIGIGIF GLVMAPLLTS GLGGAFVFSI LGLGLMGLTY 
GPIGAALAAP FPTAVRYTGA SMTFNLAGIF GASLAPYIAT WLATNYSLGH VGYYLMGAAL 
ITLVCLLLSN EEEVSG