Gene Smon_1043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smon_1043
Symbol
ID	8600771
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptobacillus moniliformis DSM 12112
Kingdom	Bacteria
Replicon accession	NC_013515
Strand	-
Start bp	1132196
End bp	1133503
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	31%
IMG OID
Product	extracellular solute-binding protein family 1
Protein accession	YP_003306383
Protein GI	269123806
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATAAAA AATTTAAAAT ATTAATATCT GTAATTTTTT TAGGTATTAC TGTATTTTCT 
TGTGGGACTA AAAATAGTAA AGATGAAGTA GTTACAATTA AATATTGGTC TTTCCCTAAC 
TTTAATGCAG ATTCTGAATT AAAAACACCA GAAGAATTTG ACATGGCTTT AATAAAAGCT 
TTTGAAGAAG CTAATCCAGA TATTAAAGTT GAATATCAAA AAATAGATTT TACAGATGGA 
CCAGCAAAAC TTGAAACATC TATTATTTCA AAATCTAATC CTGATGTTAT TATAGATGCA 
CCAGGTAGAG TAATAGATTG GGCTAAAAAA GGATATTTAG TTCCTTTTGA TATAGATACA 
TCTATTTATT CTAACACAAT AGTTTCAGCT GCAAGTCATG AAGGAAAATT GTATCTATAT 
CCTTTAGGAA CTGCACCATT TGTTATGGCA TTTAATAAGG TAATTACAGA TAAATTAGGT 
CTTACTCACA TGTTGCCATT AGATAGAGAA GGAAGAAATT GGACTGTTGA AGAATTTGAA 
GCTCTGTTAA TGGCTATTAA AGAAAAAGAT CCAAGTATAG ATCCAATAAT ATTTTTCAAT 
AAAACACCAG ATGGTAGTCA TGGATCAAGA TCTTTTGTTT TAAACTTATT TGATACTTGG 
CTTACAGATA AAGATATAAC TAAATATATT GTTAATAATG AAAGAGGAGT TAAAGGTTTA 
GAATGGGCTA AAAAAGCACA TGATATGGGA CTTTTAGGTG ATGGTGCTTC TTCAGAAGCA 
AGAGATGCAT TGGAAGCATT TAGAAGTGGT CTTGCAGCAG GAACTATGAT TTATTCACCA 
GGTTTAAATG CTATAAGTTC TAACCAACAA GCTAAGGCAG AAGGTAGATT AGATCCAGTT 
TATGTTGCTA TGCCAAATAA TGGAGGGCAG GCTAAATATG AATTATTATT AGCAGGAGCT 
GCTGTATTTA ATAATAATGA TGAGGCAAAG ATAGAAGCTT CTAAAAAATT TGTAGATTTT 
GTAATAAATG ATCCAGTGTG GGGACAAAGA GCTCTTAAAG CAACAAGAAA CTTCTCACCA 
GTTGGAAAAA CAGGATTATA TGGAGATGAT GAGGAAACTA AGTTTATAGA AAATATAAAC 
AGTAATGGAA ATTATGGTCC TTATTACAAC ACTATAGATG GTTTTGCTCA AATGAGACCA 
TTATGGTCAA ATATGGTTCA AGCTGTATTA AATGGTCAAA TAAGTCCAAA AGCTGGATTA 
GATAAATTTG TTATAGATGC AACTAAAGCA ATGGAAGATG CTAAATAA

Protein sequence

MYKKFKILIS VIFLGITVFS CGTKNSKDEV VTIKYWSFPN FNADSELKTP EEFDMALIKA 
FEEANPDIKV EYQKIDFTDG PAKLETSIIS KSNPDVIIDA PGRVIDWAKK GYLVPFDIDT 
SIYSNTIVSA ASHEGKLYLY PLGTAPFVMA FNKVITDKLG LTHMLPLDRE GRNWTVEEFE 
ALLMAIKEKD PSIDPIIFFN KTPDGSHGSR SFVLNLFDTW LTDKDITKYI VNNERGVKGL 
EWAKKAHDMG LLGDGASSEA RDALEAFRSG LAAGTMIYSP GLNAISSNQQ AKAEGRLDPV 
YVAMPNNGGQ AKYELLLAGA AVFNNNDEAK IEASKKFVDF VINDPVWGQR ALKATRNFSP 
VGKTGLYGDD EETKFIENIN SNGNYGPYYN TIDGFAQMRP LWSNMVQAVL NGQISPKAGL 
DKFVIDATKA MEDAK