Gene Smed_1702 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1702
Symbol
ID	5322560
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	1780799
End bp	1782067
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	59%
IMG OID	640790641
Product	extracellular solute-binding protein
Protein accession	YP_001327373
Protein GI	150396906
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.57478
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATACGCA TCGATCTCAA AAGAATTTGC AGCGTGGCGG TGATTGCCAT GCTGGCAACG 
CCGGCGCTTG GGGAGCCCGT GACCATCGCG GTATGGATGC ATGAACATCC ACCAAGACTG 
GCGCTGGACG AGAAGTTGGT CGCCGCATTC GAGCAGGCCA ATCCCGACAT AAATGTCGAC 
CTGACCATTT TCCCGAACGC TCAGTTCGAG CAGCGGCTTC AGATTGGATT CGCCAGCGGC 
GACGGGCCGG ACCTGTTCAA CAGTGGCTCG TTCAATATCG GGCAATATCG CCATTCCCGA 
TTGTTGGCTC CGGTCGATCT GAAGACGGTG GGTGTCGATG ATTTGAATGA ACTCAAGGCG 
AAATTCGGGA TCGGCATCGC CGGCGCCGAG TTTGACGGTG TCGCTTACGG ACTGCCGACG 
GAGGTGAGCA ATTATGCGTG CGTCGCCAAC AATGCGCTGT GGCGTACGGC GGGGCTCGAT 
CCCGCAAAAG ATGCACCGGC CACTTGGGAG GAGATGGTTG AAGTCGCCCG CAAGCTGACC 
CGCCGGGATG ACGGAAATGT TCCGGTCGTA CGCGGCTTCG ACTTCAACTG GTCCGACCCG 
ATCTTCATGT GGTTGACGTT CAACGCGATG GTGAACCAGC TTGGCGGCAC CGTCATCGAT 
GAGGCGGCGT TGACTGCGGA TTTCGACTCG GTTCAGGTCC GCACGGTCAT GGACTTCTGG 
AGCGCCTGGG CCAATGATTG GGCACTGGGC GGACCGCAAT ATACCGCGAG CCGCGATGCT 
TTTCTGGCTG GCGAACTGGC TACGGAATGC ACCTTCGGCT CATGGGGACG CGATCAGTTC 
AAAGCGGCAG GGATCGATTA TACCTTCTTT CCTGTACCGC GCTGGCGTGA AGGAACGGTC 
GATACCGGTT TCAACGCCTA TGCCTATTAC ATGATGGTCA ATGCCAATGC CCCGCCGGAA 
CGCCAGGAGG CAGCGTGGCG CTTTGCCGCG TTCTATGCGA GCCAGGGCGA GGCCCTCTTC 
GAAGAAGCTG GGCTCTTCAC CACGGTGCCG GCAGTCCAGG AGCTGGAAAG CTATACATCC 
GATGGTAGTA ACACGATCTT CACCGACGAG CTGGACAAGG CGGTGTTTTC GCCCCGTGTG 
CCGGGTTTCA ACGAGCTTGG CGACGCTCTG GCTCGCGCCC GCGACCGGAT CGTTATAAAC 
CATGAAGATG CTTCCGCCGC TCTCGGCGAG CTCGAGGCTG AGGCGTCGAC CATTCTCGGA 
CGGTTTTGA

Protein sequence

MIRIDLKRIC SVAVIAMLAT PALGEPVTIA VWMHEHPPRL ALDEKLVAAF EQANPDINVD 
LTIFPNAQFE QRLQIGFASG DGPDLFNSGS FNIGQYRHSR LLAPVDLKTV GVDDLNELKA 
KFGIGIAGAE FDGVAYGLPT EVSNYACVAN NALWRTAGLD PAKDAPATWE EMVEVARKLT 
RRDDGNVPVV RGFDFNWSDP IFMWLTFNAM VNQLGGTVID EAALTADFDS VQVRTVMDFW 
SAWANDWALG GPQYTASRDA FLAGELATEC TFGSWGRDQF KAAGIDYTFF PVPRWREGTV 
DTGFNAYAYY MMVNANAPPE RQEAAWRFAA FYASQGEALF EEAGLFTTVP AVQELESYTS 
DGSNTIFTDE LDKAVFSPRV PGFNELGDAL ARARDRIVIN HEDASAALGE LEAEASTILG 
RF