Gene Smed_2187 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2187
Symbol
ID	5323047
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	2262860
End bp	2264020
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	60%
IMG OID	640791125
Product	extracellular solute-binding protein
Protein accession	YP_001327855
Protein GI	150397388
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.227535
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.141729
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCAGA TCCTGAAATC CTGTACTGCG CTCACCCTGT CGATGGCGCT CGTCGCGCCT 
GCCTTTGCGC AGGAGCCGCC GAAGGAACTG GGGCCAGGCG AAGGCGCGCT CTCGATCGTC 
GCCTGGGCGG GCTATATCGA GCGCGGCGAG ACTGACAAGA ATTACGATTG GGTGACCGAT 
TTCGAGAGCA AGACGGGATG CAAGGTCAGC GTCAAGACGG CGGCAACCTC GGATGAGATG 
GTCGCTCTGA TGAACGAAGG CGGCTTCGAC CTCGTCACCG CTTCCGGCGA CGCCTCCCTC 
CGCCTTGTAG CCGGCAAACG CGTCCAGCCG ATAAACACCG ATCTCATCCC CAGTTGGAAG 
ACGATCGACG AGCGCATGCA GAACGCCCCA TGGCACACGG TCGACGGTGT CCACTACGGC 
ACACCCTATG TCTGGGGGCC GAATGTTCTG ATGTACAATA CCGAAGCCTT CAAGGATCAG 
CCGCCGAAGA GCTGGAATGT CGTTTTCGAA GAGACGACAT TGCCCGACGG CAAGTCGAAC 
AAGGGCCGCA TTCAGGCTTA TGACGGCCCC ATCCATGTGG CCGACGCTGC CAACTACCTG 
ATGGCGCACA AGCCAGACCT CGGCATCAAA GACCCCTACG AGCTGAATGA GGACCAGTAC 
AAGGCAGCAC TCGACCTGTT GCGGACCCAA CGCACACTGG TCGGCCGCTA CTGGCACGAC 
GCGATGATCC AGATCGACGA TTTCAAGAAT GAAGGCGTCG TGGCCTCCGG CTCCTGGCCC 
TTTCAGGTCA ATCTGATGCA GGCCGAAAAG CAGCCTGTAG CCTCGATCAT TCCGGAAGAG 
GGAGTGACGG GCTGGGCCGA TACGACGATG CTGCATTCCG ACAGCGAACA TCCGAACTGC 
GCCTATATGT GGATGGAGCA TTCGCTTTCG CCGAAGGTCC AGGGTGACGT CTCGGCCTGG 
TTCGGCGCCA ACCCCTCGGT CGGCGCCGCC TGCAAAGGCA ACGCCCTTCT GACCGACGAG 
GGTTGCAAGA CCAATGGCTA TGACGACTTC GAAAAGGTCA AGTTCTGGAA GACGCCGGTA 
ACGAAATGCG AGAGCCAGGG CGAATGCGTG CCCTATCACC GCTGGGTCTC CGACTATATC 
GGCGTCATCG GCGGGCGGTA A

Protein sequence

MKQILKSCTA LTLSMALVAP AFAQEPPKEL GPGEGALSIV AWAGYIERGE TDKNYDWVTD 
FESKTGCKVS VKTAATSDEM VALMNEGGFD LVTASGDASL RLVAGKRVQP INTDLIPSWK 
TIDERMQNAP WHTVDGVHYG TPYVWGPNVL MYNTEAFKDQ PPKSWNVVFE ETTLPDGKSN 
KGRIQAYDGP IHVADAANYL MAHKPDLGIK DPYELNEDQY KAALDLLRTQ RTLVGRYWHD 
AMIQIDDFKN EGVVASGSWP FQVNLMQAEK QPVASIIPEE GVTGWADTTM LHSDSEHPNC 
AYMWMEHSLS PKVQGDVSAW FGANPSVGAA CKGNALLTDE GCKTNGYDDF EKVKFWKTPV 
TKCESQGECV PYHRWVSDYI GVIGGR