Gene Smed_2358 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2358
Symbol
ID	5323219
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	2433714
End bp	2435039
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	62%
IMG OID	640791296
Product	extracellular solute-binding protein
Protein accession	YP_001328025
Protein GI	150397558
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACTTGA GAACTTTCCT GCTGGGCACG TGCTCGGCAG CCGCACTGGC CGGCTTGACT 
CACGCGGGCT GGGCCCAAGC GGAGACCCTG ACCATTGCCA CCGTGAACAA TGGCGACATG 
ATCCGGATGC AGAAGCTGAC GGACGATTTC ACGTCGAAGA ACCCGGACAT CCAACTCGAG 
TGGGTCACTC TTGAGGAAAA CGTCCTGCGC CAGCGCGTCA CGACGGACAT TGCGACCAAG 
GGCGGTCAGT ACGACATCAT GACGATCGGC ACCTATGAAG TGCCGATCTG GGCGAAACAG 
GGCTGGCTCC TGCCTCTGGA CAATCTCGGC CCCGAATACG ACGTAGACGA CCTTCTGCCG 
GCGATCCGCA GCGGCCTGAC CATCGATGGC AAGCTTTATG CCGCGCCCTT CTACGGCGAA 
AGCTCGATGG TCATGTATCG CAAGGACCTG TTCGAGAAGG CGGGTCTCAC CATGCCCGAT 
GCGCCGACCT GGGAATTCGT TGCCGAAGCG GCTCGCAAGA TCACCGACAA GAGCAACGAG 
ATCTACGGCA TCTGCCTTCG CGGAAAGGCT GGATGGGGCG AGAACATGGC CTTCCTGACG 
GCCACGGCAA ACGCCTTTGG CGCCCGCTGG TTCGATGAGA ACTGGAAGCC GCAATTCGAT 
CAGCCGGAGT GGAAGAACGC TCTCGACTTC TACGTCAAGC TGATGAATGA CGCCGGCCCC 
CCCGGTGCCT CGTCCAACGG CTTCAACGAA AACCTGTCGC TGTTCCAGAC CGGCAAGTGC 
GGGATGTGGA TCGACGCGAC CGTCGCCGCC TCCTTCGTCA CAAATCCGAA GGAGTCGACT 
GTCGCCGACA AGGTTGGTTT CGCGCTCGCT CCCGATACCG GCCTCGGAAA GCGCGGCAAC 
TGGCTCTGGG CCTGGAACCT CGCGGTTCCG GCGGGCACGC AGAAGGCCGA AGCGGCGCAG 
AAGTTCATCG CCTGGGCAAC GGGCAAGGAA TATCTGAATC TGGTTGCCGA GAAGGAGGGC 
TGGGCGAATG TTCCTCCCGG CACCCGCATC TCTCTCTATG AGAACCCGGA ATACCAGAAG 
GCGGCGCCCT TCGCGAAGAT GACGCTGGAC TCGATCAATG CGGCCGACCC GAAGAACCCG 
GCGGTGAAGC CGGTGCCATA TGTCGGCGTT CAGTTCGTGG CGATCCCGGA ATTCCAGGGC 
CTCGGCACGG CGGTCGGGCA GGTATTCTCG GCAGCTTTGG CCGGCCAGAT GAGCGTCGAC 
CAGGCACTCG CGAGCGCACA GCAGCTGTCG ACCCGCGAAA TGACCAAGGC CGGCTACATC 
AAGTGA

Protein sequence

MNLRTFLLGT CSAAALAGLT HAGWAQAETL TIATVNNGDM IRMQKLTDDF TSKNPDIQLE 
WVTLEENVLR QRVTTDIATK GGQYDIMTIG TYEVPIWAKQ GWLLPLDNLG PEYDVDDLLP 
AIRSGLTIDG KLYAAPFYGE SSMVMYRKDL FEKAGLTMPD APTWEFVAEA ARKITDKSNE 
IYGICLRGKA GWGENMAFLT ATANAFGARW FDENWKPQFD QPEWKNALDF YVKLMNDAGP 
PGASSNGFNE NLSLFQTGKC GMWIDATVAA SFVTNPKEST VADKVGFALA PDTGLGKRGN 
WLWAWNLAVP AGTQKAEAAQ KFIAWATGKE YLNLVAEKEG WANVPPGTRI SLYENPEYQK 
AAPFAKMTLD SINAADPKNP AVKPVPYVGV QFVAIPEFQG LGTAVGQVFS AALAGQMSVD 
QALASAQQLS TREMTKAGYI K