Gene Smon_1046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smon_1046
Symbol
ID	8600774
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptobacillus moniliformis DSM 12112
Kingdom	Bacteria
Replicon accession	NC_013515
Strand	-
Start bp	1135324
End bp	1136631
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	32%
IMG OID
Product	extracellular solute-binding protein family 1
Protein accession	YP_003306386
Protein GI	269123809
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAAAA AAATTAAAAT ATTAGCAGCT ACAGCTGCAT TAGGACTTAC AGTATTTGCT 
TGTGGTAAAA AAGCAGAAAC AAAACCAGAA GGACCTGTAA CTATTAAATA TTGGTCTTTC 
CCTAATTTTA CGGCAGATTC TGAATTTAAA ACACCTGAAG AATTTGACAT GGCTTTAATA 
AAAGCATTTG AGGAAGCTAA TCCACAAATT AAAGTTGAAT ATCAAAAAAT TGATTTCACA 
GATGGACCAG CAAAACTTGA AACAGCTATT CAATCTAAAT CAACTCCTGA TGTTGTTATA 
GATGCTCCAG GAAGAATAAT AGATTGGGCA AAAAAAGGAT ATTTAGTTCC ATTTGATGCA 
GACACATCTA AGTATTCTAA ATCTATTATA TCAGCTTCAA GTCATGATGG TAAATTATAT 
CTATATCCAT TAGGAACAGC ACCATTTATC ATGGCATTTA ATAAAGTAAT TACTGATAAA 
TTAGGTGTTA CTGATATGTT GCCATTAAAT AAACCAGGTA GAAACTGGAC AGTGGCTGAA 
TTTGAAGCTC TATTAATGGC TATTAAAGAA AAAGATCCAA AAATAGATCC AGTGCTATTT 
TACACTAAAT CACAAGCTGG AGATCAAGGA CCAAGAGCAT TTGTTTCTAA CTTATTTGAT 
TCATGGATAA CAGATAAAGA AGTAAGTAAA TATACTATTA ATGATGAAAA TGGAGTTAAA 
GCTTTAGAAT GGATTAAAAA AGCTTATGAT AAAGGATTAT TAGGAAAAGG AGTTTCAGCA 
GAAGCAAAAG ATGCATTAGA AGCATTTAGA AGTGGAAATG CAGCAGGAAC TATTCTTTAC 
TCACCAGGAT TAAAAGGTGG AAAAGCTGAT GTTGATGCTA TTATGGCAGG TAAATTAGAA 
CCAGTATATG TTTCTTATCC TAATGATAGT GGACAAGCTA AATTTGAGTT CTTATTAGCA 
GGAGCAGCTG TATTTGATAA TGAAGATCCA GCAAGAGCTG AAGCAGCTAA GAAATTTGTT 
GACTTCATAG CTAATGATCC AGTATGGGGG CAAAGGGCTC TTAAAGCAAC AAGAAACTTC 
TCACCACTTG GTAAAACAGG ATTATATGGT GATGATGTAG AAACTAAATT TATAGAAGAA 
CAAAGTGCAA ACTTTGGACC TTATTACAAT ACTATAGATG GTTATGCTCA AATGAGACCA 
TTATGGTTTA ACATGGTTCA ATCAGTGTTA AATGGACAAG TTAGTGCTAA AGAAGCATTA 
GATAAATTCG TAGAAAATGC TAATAAAACA ATTGAAGATG TAAAATAG

Protein sequence

MNKKIKILAA TAALGLTVFA CGKKAETKPE GPVTIKYWSF PNFTADSEFK TPEEFDMALI 
KAFEEANPQI KVEYQKIDFT DGPAKLETAI QSKSTPDVVI DAPGRIIDWA KKGYLVPFDA 
DTSKYSKSII SASSHDGKLY LYPLGTAPFI MAFNKVITDK LGVTDMLPLN KPGRNWTVAE 
FEALLMAIKE KDPKIDPVLF YTKSQAGDQG PRAFVSNLFD SWITDKEVSK YTINDENGVK 
ALEWIKKAYD KGLLGKGVSA EAKDALEAFR SGNAAGTILY SPGLKGGKAD VDAIMAGKLE 
PVYVSYPNDS GQAKFEFLLA GAAVFDNEDP ARAEAAKKFV DFIANDPVWG QRALKATRNF 
SPLGKTGLYG DDVETKFIEE QSANFGPYYN TIDGYAQMRP LWFNMVQSVL NGQVSAKEAL 
DKFVENANKT IEDVK