Gene Smed_0473 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0473
Symbol
ID	5321307
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	511313
End bp	512350
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	61%
IMG OID	640789408
Product	extracellular solute-binding protein
Protein accession	YP_001326165
Protein GI	150395698
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.868769
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGGCAT GTGGGGTAAT TGTCGTTCTG ACGGCACTGC TTTGCGCTTC CGCAAGCCGT 
GCCGAGACGC TCAACCTGCT TATCTGGGAA GATTATGTCG ACCAGGATCT CATCGATCGC 
TGGACCGAGA AGACGGGCGT CTCCATCCGC CAGATAAATT TCGACAGCGA CGACGCCCGC 
GACGAGATCC TCGCAGATCC CGGCCGCAAC ATCGATCTTG TCATCGTCGA TGAGGGCGGC 
GCGAAGCTTT TCGGCCGCAA GGGCATCATC GAGAAGCTCT CCGACGTCAA CGTTCCCGCG 
CTCCAGGACT ATGCGCCGGA ATGGCGGAAA GCCTGCGCCG ACTACGGGCT TCCCTATTTC 
TGGGGAACAG TAGGCATCCT TTACCGCTCC GACGTGGTTA CACAGCCGCC GGCGTCCTGG 
CAGGACATGA TGCGTCCTGC GCCGGCTCTT CGCAAGCACA TCGCCATGTT CGATGACCAA 
AGCGAGATCT TCGTACCCCC GTTGATGCTG CTCGGCGCCT CGGTCAATGC CGATGATACC 
GAAACCCTCA AGGCCGCTTT CGGGCTCCTG AAGGCACAGG CGCCTTTCGT ACTGACCTAT 
GATTACGTCA TCACCTCGAT TCAGGATCCG GCTTTGGCCG GGGACATATA TCTGGCGCTG 
GGCTACAGCG GCGATCAGCA CGTACTCAAC AAAAAAGCTG GAAAGGCGGG GCTCTGGCGC 
TATTCGGTCC CGAAAGAGGG CACGTTGTCG TGGCTCGACT GCTTCTCGGT CACGGCCGGG 
TCGCCCCGCA AGCAACAGGC CCTCGCGTTC CTGAATTTCA TCGGATCGCC TGAGGCGGCC 
GCCGCCAACG CGCTCGCGCT CAACATGCCG ACCGCAAGCG GCCCGGCGCT CAGGCTCCTT 
CCAGACACCA TGCGCGCCGA TCCGGAAATC TACCCGCCGA CCGAAACAAT GGAGAAGAAC 
CAGCATCCCC GGGAACTGTC CGTCCGCTCG ATCGAGGCGC GCCGGCGCAT TATCAACACT 
TTGGCGAATT TCCAGTGA

Protein sequence

MRACGVIVVL TALLCASASR AETLNLLIWE DYVDQDLIDR WTEKTGVSIR QINFDSDDAR 
DEILADPGRN IDLVIVDEGG AKLFGRKGII EKLSDVNVPA LQDYAPEWRK ACADYGLPYF 
WGTVGILYRS DVVTQPPASW QDMMRPAPAL RKHIAMFDDQ SEIFVPPLML LGASVNADDT 
ETLKAAFGLL KAQAPFVLTY DYVITSIQDP ALAGDIYLAL GYSGDQHVLN KKAGKAGLWR 
YSVPKEGTLS WLDCFSVTAG SPRKQQALAF LNFIGSPEAA AANALALNMP TASGPALRLL 
PDTMRADPEI YPPTETMEKN QHPRELSVRS IEARRRIINT LANFQ