Gene Smed_3170 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3170
Symbol
ID	5324049
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	3331901
End bp	3333145
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	62%
IMG OID	640792118
Product	extracellular solute-binding protein
Protein accession	YP_001328829
Protein GI	150398362
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCAAGT TCATGACGAC GACTGCTGTT GCAGCATTGA TGCTGGCGGC TACGGCCGCG 
CGCGCTGCCG AGAATGTGGA AGTATTGCAC TGGTGGACGT CAGGCGGCGA AGCCGCGGCC 
CTCGACGTCC TTAAGAAGGA TCTGGAGAGC AAAGGCATCA GCTGGACCGA CATGCCGGTC 
GCCGGCGGCG GCGGCACCGA AGCCATGACG GTGCTTCGTG CCCGTGTCAC AGCGGGCAAT 
GCACCGACGG CCGTGCAGAT GCTCGGCTTC GACATTCTCG ATTGGGCAAA AGAAGGCGCA 
CTCGGCAATC TGGACGAGGT CGCCGCCAAA GAAGGCTGGG ACAAGGTCAT CCCCGCCGCC 
CTGCAGCAGT TCTCGAAATT CGACGGCCAC TGGATTGCCG CGCCGGTGAA CGTCCACTCG 
ACGAACTGGG TCTGGATCAA CAAGGCCGCG CTCGACAAGG CCGGCGCCAA GGAGCCGACG 
ACCTGGGAAG AGTTGATCGC ACTGCTCGAC AAGTTCAAGG AGCAGGGCAT CACCCCGATC 
GCTCATGGCG GGCAGCCCTG GCAGGATGCC ACGATCTTCG ACGCTGTGGT TCTTTCGCTC 
GGCACCGACT TCTACAAGCA GGCCTTCATC GACCTCGATC CGGCAGCGCT CGGAGGCGAC 
AAGATGAAGG AAGCTTTTAA CCGGATGACG AAGCTGCGCT CCTATGTGGA CGACAACTTC 
TCCGGCCGCG ACTGGAACCT CGCCTCGGCG ATGGTCATCG AGAACAAGGC CGGCCTTCAG 
TTCATGGGGG ACTGGGCGAA GGGCGAATTC CTGAAGGCGA ACAAGGTGCC CGGCACCGAT 
TTCGTCTGCA TGCGCTACCC GGGGACTCAA GGCTCCGTAA CCTTCAACTC CGACCAGTTC 
GCAATGTTCA AGGTTTCCGA GGACAAGGTC CCGGCGCAGC TGCAGATGGC CACGGCGATC 
GAGAGCCCGG CCTTCCAGTC GGCGTTCAAT GTCGTCAAGG GGTCTGTTCC CGCCCGCACC 
GACGTTCCCG ATACCGATTT CGACGCCTGC GGCAAGAAGG GCATCAAGGA CCTCGCGGAA 
GCCAATACCA ACGGCACGCT CTTTGGATCC ATGGCGCATG GTCATGCCAA TCCGGCGTCT 
GTCAAAAATG CGATCTACGA CGTGGTCACG CGCCAGTTCA ACGGCGAACT CAGCTCGGAG 
GAGGCAGTCA CGGAACTCGT CGCTGCTGTC GAAGGCGCGA AGTAA

Protein sequence

MRKFMTTTAV AALMLAATAA RAAENVEVLH WWTSGGEAAA LDVLKKDLES KGISWTDMPV 
AGGGGTEAMT VLRARVTAGN APTAVQMLGF DILDWAKEGA LGNLDEVAAK EGWDKVIPAA 
LQQFSKFDGH WIAAPVNVHS TNWVWINKAA LDKAGAKEPT TWEELIALLD KFKEQGITPI 
AHGGQPWQDA TIFDAVVLSL GTDFYKQAFI DLDPAALGGD KMKEAFNRMT KLRSYVDDNF 
SGRDWNLASA MVIENKAGLQ FMGDWAKGEF LKANKVPGTD FVCMRYPGTQ GSVTFNSDQF 
AMFKVSEDKV PAQLQMATAI ESPAFQSAFN VVKGSVPART DVPDTDFDAC GKKGIKDLAE 
ANTNGTLFGS MAHGHANPAS VKNAIYDVVT RQFNGELSSE EAVTELVAAV EGAK