Gene Smed_0292 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0292
Symbol
ID	5321124
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	310401
End bp	311759
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	61%
IMG OID	640789227
Product	extracellular solute-binding protein
Protein accession	YP_001325986
Protein GI	150395519
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAAAGAT CGTTTCTGAT CGGCGTGGCC GCACTCGCAT TGCTTGCAGG AGCCGCCGGC 
GCTGCCGACC TGAAGTTCAA GCCGGGCGAG GATTCCAAAT TCAATTGGGC GAGCCTGGAG 
GATTTCAAGA AGGGCCACGA CCTCAAGGGT CAGACGCTCA CGATCTTCGG TCCCTGGCGC 
GGCGAGGACG AGGCTCTGTT CAAGAGCGTA TATGCCTATT TCGTCGAGGC GACCGGTGTT 
GAGCTGAAAT ATTCGTCCTC CGAGAACTAC GAGCAGCAGA TCGTAATCGA TACGCAGGCG 
GGAAGCCCGC CTGATATCGC AATCCTGCCG CAGCCCGGTC TGATCGCCGA TCTCGCCGCC 
AAGGGGCTCC TGACGCCGCT CGGCGACGAG ACCAAGCAAT GGCTTCTCGA CAACTATGCT 
GCGGGCCAGT CATGGGTCGA CCTCTCCACC TATAACGGCA AGGACGGCAC GCCCGCGCTT 
TACGCTTTTC CATACAAGAT CGACGTCAAG TCGCTCGTCT GGTACGTGCC GGAGAACTTC 
GAGGATGCCG GCTATGAAGT TCCGAAAACC ATGGAGGAAC TGAAGGCACT GACGGAGAAG 
ATCGCCGAAG ACGGCGAAAA GCCGTGGTGC ATTGGTCTCG GTTCGGGCGG CGCGACCGGC 
TGGCCGGCCA CCGACTGGGT CGAGGACCTG ATGCTGCGGA CCCAGCCCGC CGAGACCTAT 
GACAAATGGG TGAAGAACGA GATACCGTTC ACCGATGCGG CGGTCACGGG TGCGCTTGAG 
GAGTTCGGCT GGTTCGCCCG CAACGACGCC TTCGTCGAAG GCGGCGCAGC AGCGGTGGCG 
TCGGCCGACT TCCGAGACAG CCCGAAAGGC CTCTTCAGTT CTCCGCCGAA ATGTTATCTG 
CACCACCAGG CCTCGTTCAT TCCGTCCTTC TTCCCGGAAG GTAAGGTCGT CGGAGAGGAT 
GCCGACTTCT TCTACATGCC GCCTTATGAG AGCAAAAAGG AGCTCGGCAA TCCGGTGCTC 
GGCGCAGGCA CGCTTGCCAT GATCACCAGG GACACTCCAG CCGCGCGCGC CTTCATCGAG 
TTCCTGAAGA CCCCGATCGC GCACGAGGTT TGGATGGCGC AGACGAGCTT CCTCACGCCG 
TATAAGAGCG TCAACGTCGA CGTCTACGGA AATCCGCCAT TGAAGAAGCA GGGTGAAATC 
CTGCTGAACG CCACGACGTT TCGCTTCGAC GGTTCCGACC TGATGCCTGG CAAGATCGGC 
GCCGGCGCCT TCTGGACCGG CATGGTCGAT TTCGTCGGGG GCAAGCCTGC TGCCGACGTC 
GCCGCCGGCG TGCAGAAGGC CTGGGACTCG ATCAAGTAA

Protein sequence

MKRSFLIGVA ALALLAGAAG AADLKFKPGE DSKFNWASLE DFKKGHDLKG QTLTIFGPWR 
GEDEALFKSV YAYFVEATGV ELKYSSSENY EQQIVIDTQA GSPPDIAILP QPGLIADLAA 
KGLLTPLGDE TKQWLLDNYA AGQSWVDLST YNGKDGTPAL YAFPYKIDVK SLVWYVPENF 
EDAGYEVPKT MEELKALTEK IAEDGEKPWC IGLGSGGATG WPATDWVEDL MLRTQPAETY 
DKWVKNEIPF TDAAVTGALE EFGWFARNDA FVEGGAAAVA SADFRDSPKG LFSSPPKCYL 
HHQASFIPSF FPEGKVVGED ADFFYMPPYE SKKELGNPVL GAGTLAMITR DTPAARAFIE 
FLKTPIAHEV WMAQTSFLTP YKSVNVDVYG NPPLKKQGEI LLNATTFRFD GSDLMPGKIG 
AGAFWTGMVD FVGGKPAADV AAGVQKAWDS IK