Gene Smed_3847 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3847
Symbol
ID	5318722
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	304805
End bp	305905
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	60%
IMG OID	640775659
Product	extracellular solute-binding protein
Protein accession	YP_001312592
Protein GI	150375996
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGACT TCATCGCAAG CCGCCGTTCC ACGCTGAAGC TTCTGGCTGC CGGGACCGGC 
GTACTGGCAG CGCCGGCGAT CATCCGCCCG GCATTCGCCC AGTCCAAGGT CGTGAACATC 
ACCACCTATG ACAAGTTCGT TCCGCAGTCC TTCATCGACG CGTTCCAGAA GGAGACGGGG 
ATCGAAGTGC GCATTCGCCT CACCGACGAC CAGGGCAAGC AGTATAACGT GCTCTCCGCC 
GAAGGCGCGA CGCCTTCATC GGACATCGTC ACGGTCACCG GTCACCGCCT GTCGCAGTTC 
ATCGGCTCCA ACCTGCTTTC GCCGCTCGAC ACCGGCCGGC TGAAGAACTG GGGCAATCTC 
GCTCCCGCAT ACAAGGGCGC ACCGCAGCTG ACCGTCGACG GTTCGGTCTA CGGGGTGCCG 
CTGCTTGCCG GTTTCGAAGG CCTTGCCCGC AATACGGACT ATACCAAGGC CTCCGACAGC 
TGGGCCATCA TGTTCGACAA GGAATACAAG GGCCTGACGT CTTATATCAT TTCCGATTTC 
CTCCAGATCA CCATGCGCTA TCAGGGTAAT GACGGCGACT TCGTCACATA TGAAGGCAAG 
CCGGAGGAGG CGCAGGCCGC AACCAACAAG GCACGCGACT ACCTGATCCA GAACAAGGAC 
ATGGTCCGCA AGTACTACGA CGCCGGCTCC GAGGTGCAGC AGATGTTCGT CAACGAGGAC 
ATCTATGTCG CCCACAGCTG GTCCGGCCCC GCGGCAAAGC TGATCATGGA CGGACATCCG 
ATCGAGATAT CGGTTCCGAA GGAGGGGACC TATGGCTTCC TCTACTCCTT CAACGTGGTG 
AAGAACGGAC CGAATACGGA TGCGGCTTAT ACATTCCTCG ACGCCATCCT CTCCTCTCCG 
GAAATCGGGG CAGCGATGAG CCGTCAGTCG GGCTTCGCCT CCGCATTCGG CGGCGTGGAC 
AAGGTGCTGA ACGACAAGGA GCGTGCTGCC ATGGCCCTGC CGCAGGAACA GACCGAGCGC 
ATCCAGTTCT TCAGCTCCGT CAACCGCGAC ATGAAAAACG AGATGGTCGA CAAGGCAGTC 
GCCGAGATCA AGGCAGCCTG A

Protein sequence

MKDFIASRRS TLKLLAAGTG VLAAPAIIRP AFAQSKVVNI TTYDKFVPQS FIDAFQKETG 
IEVRIRLTDD QGKQYNVLSA EGATPSSDIV TVTGHRLSQF IGSNLLSPLD TGRLKNWGNL 
APAYKGAPQL TVDGSVYGVP LLAGFEGLAR NTDYTKASDS WAIMFDKEYK GLTSYIISDF 
LQITMRYQGN DGDFVTYEGK PEEAQAATNK ARDYLIQNKD MVRKYYDAGS EVQQMFVNED 
IYVAHSWSGP AAKLIMDGHP IEISVPKEGT YGFLYSFNVV KNGPNTDAAY TFLDAILSSP 
EIGAAMSRQS GFASAFGGVD KVLNDKERAA MALPQEQTER IQFFSSVNRD MKNEMVDKAV 
AEIKAA