Gene Smon_1416 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smon_1416
Symbol
ID	8601162
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptobacillus moniliformis DSM 12112
Kingdom	Bacteria
Replicon accession	NC_013515
Strand	-
Start bp	1556689
End bp	1558542
Gene Length	1854 bp
Protein Length	617 aa
Translation table	11
GC content	32%
IMG OID
Product	protein of unknown function DUF87
Protein accession	YP_003306728
Protein GI	269124151
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAGTC GTGAAATAGG GAAGATTACT TCAGTAGGCA TTCATGGAGT AATAGCTGAT 
GTAAATTCTG ATTTAGGAAA CTATATAAAT ACAATTGATG GAATCCTTTT TGTCGGAGAG 
GTTGGATCAT ATGTATCAAT TTATGAGATA GGAAGAACTG TTATAGCAGA AATAATTGGA 
GTAGATGAGA AGACTCAGTT AATTAATTCA AGGGAAATGA TCAAACCAAA TAGTAAAAGG 
CAGGTTTACT TAAATTTGAT TGGAGAAATA GTTGAGGATA AATTCCAATT TGGAGTATCA 
AAAATGCCAT TGATTTTCTC AACTGTTTAT ATTGTTTCAC AAAAGGAATT GATTACTATG 
CTTGAAGTTG GTAAAGAAGA AATAAAGATT TCTGAAGAGT CTAATAAAAC TCGAGCGATT 
TTGCTTACAA TAGGGAAATC AGTAATATTT CCGGATTACG ATGTTAAAAT AAATATTGAT 
AAGTTCTTTG GGTTTCATTT TGCTGTTTTT GGAAATACTG GGGCAGGTAA GTCTAATACT 
GTAGCTAGAA TTTTACAGAA TGTTTTTGTT AAAGATCATT ATTCGGCTAA AGGGGCGAAA 
TTTGTAATAA TTGATTCTAA TGGTGAATAT AACAAGGCTT TTTCGAAGTT AAATGAAATT 
AATCAAGATA TTAAACATTC TCTAATGATT GCAGATGAAG ATATTGATTC AAAGTTCGAA 
ATACCAGTTT GGGCGTTATC AGCAGACGAT TGGGCAACAT TACTACATGC TTCTGAAAAA 
ACGCAAATGC CTGTATTAAA AAGAGCGATA GACATTGCAC GAGTATTTTA TAGTTCTGAT 
GAAACTAATC AGGAACTACG GAACCACATT CTTGCATCCA CATTACTGGG TATTATTCAG 
AGTTCAGATT CTTCTCCATC TAAGTCGGAT AAACTTAAAG CTATAGTAAC AAAATTTGGA 
ACTAATGAAA TTAAAATGGA TTCAGTTTTA TCGAATTCTA AAACATTAAG GCAATCCATG 
AATATAAATT ATGGTTCAAT GCCCGATGAG GAAGCTGTTA TTTCATTTTT ATCTAATCAT 
CTAAATCAAG AATTAATAAC AGAAAATATC ACACGATCAA TGGTTCCGTA TAGTTTAGAA 
GATTTTAGCC AAGCGGTTGA GTTTGCGACT CTGTATGAAG GGAGTATTAG TTCACAGAGA 
ATACAAGAAT ATACTGCAAC TTTAATGACC CGATTGAATA CCATTCAGGA AGGAATCCAA 
GGACGCATTC TCTCGAGAAC AACATATAAT ACTATTGATG ATTATATAGA TATGTTATTG 
GGTGAAAACC AAATAGTGGA TCTTGATATT AGCACACTGG ACGATGCTTC AGCAGAGGTT 
GTAACAAAAG TTTTGGCTAA ACTTTTATTA GATTATTTGA AGAGAAGAGA AATAAAAGCA 
GATTCACCGA TAAATTTTAT AATCGAAGAA GCACATAGAT TCATAAAAAA CGAAGCAAAT 
TATGGAGCGG TTGGATATAA TATTTTTGAA AGAATTGCTA AAGAAGGTCG CAAATTTGGA 
ATGCTTTTGG GAATATCATC TCAAAGACCA AGTGAATTGT CTAAAACAGT AGTATCACAG 
TGTAGTAATT TTATTGTTCA TCGTGTACAA AACCCGGATG ATTTGCAATA TATATCTAGA 
ATGGTTCCAT ACATAAATCA GAATATGATA GAAAGGCTTA CTTATCTTCA GACAGGAAAT 
GCATTGGTTT TTGGTAGTGC AATAAATCTT CCGACATTAA CTAAATTTGC TCAAGCGAAT 
CCTACAACAG ATAGTGATAA TGCAAAAATA TCAGAAAAAT GGTACATTGA ATAA

Protein sequence

MSSREIGKIT SVGIHGVIAD VNSDLGNYIN TIDGILFVGE VGSYVSIYEI GRTVIAEIIG 
VDEKTQLINS REMIKPNSKR QVYLNLIGEI VEDKFQFGVS KMPLIFSTVY IVSQKELITM 
LEVGKEEIKI SEESNKTRAI LLTIGKSVIF PDYDVKINID KFFGFHFAVF GNTGAGKSNT 
VARILQNVFV KDHYSAKGAK FVIIDSNGEY NKAFSKLNEI NQDIKHSLMI ADEDIDSKFE 
IPVWALSADD WATLLHASEK TQMPVLKRAI DIARVFYSSD ETNQELRNHI LASTLLGIIQ 
SSDSSPSKSD KLKAIVTKFG TNEIKMDSVL SNSKTLRQSM NINYGSMPDE EAVISFLSNH 
LNQELITENI TRSMVPYSLE DFSQAVEFAT LYEGSISSQR IQEYTATLMT RLNTIQEGIQ 
GRILSRTTYN TIDDYIDMLL GENQIVDLDI STLDDASAEV VTKVLAKLLL DYLKRREIKA 
DSPINFIIEE AHRFIKNEAN YGAVGYNIFE RIAKEGRKFG MLLGISSQRP SELSKTVVSQ 
CSNFIVHRVQ NPDDLQYISR MVPYINQNMI ERLTYLQTGN ALVFGSAINL PTLTKFAQAN 
PTTDSDNAKI SEKWYIE