Gene Smed_2436 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2436
Symbol
ID	5323297
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	2515634
End bp	2517178
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	60%
IMG OID	640791374
Product	extracellular solute-binding protein
Protein accession	YP_001328103
Protein GI	150397636
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACGC TTCTTCTTGC GGGCACCGCC CTGCTTGCCA TGACCGGTAT CGCAACGGCA 
CGCGACATCA CCGTCGCGCA AAGTTCTGAC CTGCGCAGCA ATAATCCGGG CGTCAATCGC 
GACGGCAATA CCGATAGCGT CATCCTGCAC ATCGTCGAGG GACTCGTCGG CTACAACAAT 
GTCGGCGAAG TGAAGCCGCT GCTCGCCGAG AGCTTCGAGA TGTCTGCCGA TGGGCTGACC 
TATACGTTCA AGCTGCGCAG CGACGTGAAA TTTCACAACG GCAAAGCGAT GACGGCCGAC 
GACGTGGTGT GGAACTGGAC GCGCTACCTG AAGCCAGAGA CGAAATGGAC CTGCCTGAAA 
GATTTCGTGG AAGGCGGGGC CGCGCCTGTG ACAGGCGTCA AGGCAATCGA CGCCTCGACC 
GTCGAGATCA CGCTGGCGAA GCCGTCGGCT GTCTTCCTCG GCATGATGTC GCGTCCCGAA 
TGCGGCTTCA CCGGCATCAT CTCGAGCGAA TCCCTCGGTG CGGACGGCAG CTTCGTTCAG 
CCGATCGGGA CCGGCCCCTT CATGTGGGAC GAATGGAAGA AGGGCGAATA CGTCCATCTC 
AAGAAATTTG CCGACTATGT CTCGCCGGAA AACGAAGGAA AGCCGGATGG CATGGTCGGT 
TCGAAGCGGC CGCTTGCCGA CGGCGTCAAG TTCATGGTCA TTCCGGACGC TTCGACCGTG 
AAGGCAGGTC TGGAATCCGG CGTGCTGGAC ACGGCTGAAA TCTCGCCGGA TCTCATTCCC 
GAATTCCAGG CAAGCGAGAC GATGCAACTG ATTGTCGCGC GCAATAACGG CAAGAACCTC 
TTTTACATCC AGACTCGGGA CAAGGTCCTG AGCAATCCGG GCGTGCGCCG CGCCATGGCG 
ATGGCGCTCG ATCTGGATGA GCTCGTTGCC GCCGCCTCAA ACGGTACGGG TGAGGCGAAC 
GGCTCGATGG TGTCGCAGGA TTCGGTCTTT TTCAGCGACA CGCAGAAGAA GCGTCTGCCC 
TATGACGTCG AAGCCGCCAA AAAGGAGCTG GCGGATGCCG GCTACAATGG CGAGCCGATC 
TCGATCATAG CCAATAAGCG CGGCAACGTG CCGAGCTTCC CGGCTGCGGT CATGGCGCAG 
GCCATGATGC AGCAGGCCGG CCTCAACGTT CAGATCGAGG TGCTGGACTA CGCGACGCAG 
GTCGACCGCC GTCGGTCCGG CAATTACCAG GTGATTTCCC AGTCGGTGGC GCCGCGTCTC 
GACCCGGCCC TCATGTATTC CTTCTATGTC GGCGACAAGG ACAAGAACGC TTCCCTGATG 
TGGGACGATC CGAAGGCGAT CGAGCTGATG AACGCAGCCT ATGCCGAGGC TGACCAGGCC 
AGACGCCAGA AGATATTCGA TGAGTTTCAC GAGCTCATGC TGAAGGAAAT GCCGGGGATA 
TTCCTCTACG ACATGGTCGA TGTCTGGGGC GCGACCAGGA AATTGAAGGG CCAGCCCGTC 
TGGCAGTCGA ACGCCCGCCT TTGGGAAGTG TCAGTCGACG ATTGA

Protein sequence

MKTLLLAGTA LLAMTGIATA RDITVAQSSD LRSNNPGVNR DGNTDSVILH IVEGLVGYNN 
VGEVKPLLAE SFEMSADGLT YTFKLRSDVK FHNGKAMTAD DVVWNWTRYL KPETKWTCLK 
DFVEGGAAPV TGVKAIDAST VEITLAKPSA VFLGMMSRPE CGFTGIISSE SLGADGSFVQ 
PIGTGPFMWD EWKKGEYVHL KKFADYVSPE NEGKPDGMVG SKRPLADGVK FMVIPDASTV 
KAGLESGVLD TAEISPDLIP EFQASETMQL IVARNNGKNL FYIQTRDKVL SNPGVRRAMA 
MALDLDELVA AASNGTGEAN GSMVSQDSVF FSDTQKKRLP YDVEAAKKEL ADAGYNGEPI 
SIIANKRGNV PSFPAAVMAQ AMMQQAGLNV QIEVLDYATQ VDRRRSGNYQ VISQSVAPRL 
DPALMYSFYV GDKDKNASLM WDDPKAIELM NAAYAEADQA RRQKIFDEFH ELMLKEMPGI 
FLYDMVDVWG ATRKLKGQPV WQSNARLWEV SVDD