Gene Smon_0145 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smon_0145
Symbol
ID	8599843
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptobacillus moniliformis DSM 12112
Kingdom	Bacteria
Replicon accession	NC_013515
Strand	-
Start bp	152385
End bp	153713
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	31%
IMG OID
Product	extracellular solute-binding protein family 1
Protein accession	YP_003305512
Protein GI	269122935
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGAT TATTCAAATT AGCATTTATT GCTATTTTAT CTTTTTTTAC AATAGCTTCG 
TGTGGAGCTA AATCTAATGA GAAAGCTACA GAAGGTGAAA GGGTTACTTT AAAATTTGCT 
GCTCTTGAAA CTGCATACGG TGATAAAATG TGGTCAGAAA TTATAGAAGC ATATAAGAAG 
ATAAATCCTA ATGTTGAGAT TGAATTAAAT CAATCAAAAG ACATTGAATC TACACTACCT 
GGATTATTCC AAGCAGAAGA TTATCCAGAT GTAATTATGT TAGCTTTAAG TAGAAAAGCA 
GGTATTCCTG AAAATTTTGT TAAAGAACAA GCATTAGCAG AACTAACTTC TATTTTAGAT 
ATGAATATAC CAGGAGAAAA AGTTACTGTT AGATCTAAAT TAACTGATGG TGCAGTAGGA 
AATAATCAAA CTGACCCTTA CTTAAATGGT AAAACATATT TAATGCCTAT GTTTAATTCA 
CCTACAGGAT TATTCTTTAA TAAAGGATTA TTTGAAGAAA AAGGTTGGGA AGTTCCTACA 
ACATGGGATG AAATGTTAGA TCTTGCAAAA ATTGCAAAAT CAGAAGGAAT TTCATTATTA 
ACTTATCCTA CAACAGGATA TTTAGATTCT TTCTTACCTC CAATTTTAGC AGCTAAAGGT 
GGACCTGAAT TTTTAAATAA GGCTATGAGC TATGAAAAAG GTATATGGGA TTCTGAAAAA 
ATGAATGAAG TATTTAAAGT TTTAGGTGAA GTAGTTAAAA ATGTACATCC AACTACAGTT 
GCAAATGCAA ACAATGAAGG ATTTACTAAA AATCAACAAT TAGTTATTGA TAATAAAGCA 
TTATTTATGC CTAATGGTAC TTGGATAGTT GGAGAAATGG CAGCTACTAC TCCTAAAGAT 
TTCAAATGGG GAATGACTGC TTATCCAGCA TTCGAAAAAG GTGGAAAATC ATATGCAGTT 
AACTTCTTTG AACATATTTG GGTTCCAGCA GAAGCTAAAA ATGTTGAAGC AGCTAAAGAA 
TTTATAGCTT TCCTATACTC TGATGTAGCA GCTAAAATAT TTGCTGAAAA AGGTGCAGTT 
CAACCTATTA AAAATTATCC ATTTGATATG TTAAGTAAAG AAAATCAAGT ATTCTATGAA 
ACATTTAAAA ATGGTGCAAA CCCTCTAGCA GGTGGATTTG CAGCTACTAC TCCAGTAGAA 
GGTGTAGATG TTAGTGGAAC AGTTTATGGA ACTATAAACT CAGTAGTAAA TGGTACTAAA 
TCTGTTGAAG AATGGCAAGC TGATATAGTT AAAATGGCTG ACACTTTAAG AGAACATGTA 
ATTAAATAA

Protein sequence

MKRLFKLAFI AILSFFTIAS CGAKSNEKAT EGERVTLKFA ALETAYGDKM WSEIIEAYKK 
INPNVEIELN QSKDIESTLP GLFQAEDYPD VIMLALSRKA GIPENFVKEQ ALAELTSILD 
MNIPGEKVTV RSKLTDGAVG NNQTDPYLNG KTYLMPMFNS PTGLFFNKGL FEEKGWEVPT 
TWDEMLDLAK IAKSEGISLL TYPTTGYLDS FLPPILAAKG GPEFLNKAMS YEKGIWDSEK 
MNEVFKVLGE VVKNVHPTTV ANANNEGFTK NQQLVIDNKA LFMPNGTWIV GEMAATTPKD 
FKWGMTAYPA FEKGGKSYAV NFFEHIWVPA EAKNVEAAKE FIAFLYSDVA AKIFAEKGAV 
QPIKNYPFDM LSKENQVFYE TFKNGANPLA GGFAATTPVE GVDVSGTVYG TINSVVNGTK 
SVEEWQADIV KMADTLREHV IK