Gene Smon_0110 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smon_0110
Symbol
ID	8599808
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptobacillus moniliformis DSM 12112
Kingdom	Bacteria
Replicon accession	NC_013515
Strand	+
Start bp	115556
End bp	117409
Gene Length	1854 bp
Protein Length	617 aa
Translation table	11
GC content	32%
IMG OID
Product	PTS system, fructose subfamily, IIC subunit
Protein accession	YP_003305482
Protein GI	269122905
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATTAA CAGAATTATT AAGAGAAAAT CAGGTTATCT TCAATTTAAA TGCAGATAAT 
AAAAAAGATG CAATAATTGA AATGGCAAAG GTATTTAAAC CAGATGTAAT TAATGATCAA 
GAAAAATTCA TTGAAGACTT ATTTGCAAGA GAATCATTAT CACATACTGC ACTAGAGCTT 
GGAGTTGCAA CTCCACATGC TAAATCTCGT GGGGTAAGTA AACCAGCATT GGTTATAGCC 
ATAAAAAAAG AGGGTATAGA TTTTAGTGAA GGTCAAGAGG ATAAATCAAA GCTATTTTTT 
ATGATAGCTG TTCCTGAAAA TGAGGGTAAT TTACATATAG ATATATTAAC TAAACTTGCA 
GATGTAATGT TAGATAATGA TAAACTAAAT GCATTATTAA ATTCTACAAG CTATGATGAA 
GTTATAGATA TTATAGAAAA GGAAAAAATT ATGGAAAATA AAGAAAGTGA AAAATTTGTA 
GTAGCTGTAA CAGCATGTCC TACAGGTATA GCTCATACAT TTATGGCAAA AGATGCTTTA 
ATTAAAGCAG CTAAAGAATT AGGAGTGAAT ATTAAGGTTG AAACTAATGG GACAAATGGA 
AGAAAAGATG AAATTACTAA AGAGGATTTA GAAAAAGCAA GTGGAGTAAT ACTTGCTATA 
AATAAGAGTG TTAATGAAGA AAGATTTAAT GGATATAAGG TAATAAAGGT TGGAGCAAAA 
GACGGTATTA ATAAAGCAAA AGAGTTAATT TTAGATACTT TATCTGGTAA GGGAACTATT 
GCTAATTTTG AAAGTTCTGG AAATTCTACT TTTATGAATA ATGGTAAAAA AGGTATGTAT 
AATCACTTAA TGTCAGGTGT TTCATACATG TTACCATTAG TAATAAGTGG TGGAATATTA 
ATAGCACTTG CTTTCTTATT TGATAGTTTA GCAGGAAATT CTAATGTTGG TGGAGGATTT 
GGATCTACTT CTAAACTTGC AGCGACATTT ATGCAAATAG GTGGAGCAGC TTTCGGATTA 
TTTGTTCCTA TACTTGCAGG ATATGTTGCA TATAGTATAG GTGAAAAATC ATCTCTTGCA 
GCAGGACTTG TAGCTGGAGC TCTTGCATCA AGTGGTGGTT CAGGATTTTT AGGAGCATTA 
GTTGGTGGAT TATTTGCAGG ATATGTAACT AAATTTTATT CTAAGGTTAC TTCAAATATT 
AAAAAACAAT TACAAGGAAT TAATCTTATA CTATTTACAC CTGTTATAAC AGTTTTACTT 
ACAGGGCTTG TTATGCTATT TTTATTAAAT CCTATGGTTA GTGGTATTAA TACTGGAATA 
ACTAATTTCC TTGAAAGTAT GAGTGCAAGC TCAAGAATAC TTTTAGGTGC ATTACTTGGT 
GGTATGATGG CTGTAGATAT GGGTGGACCA GTTAATAAAG CAGCATATGT ATTTGGTACA 
GGAACATTAG CTGCAACAGT TTCTACTGGT GGTTCATCAG CTATGGCGGC AGTTATGGCA 
GGGGGTATGG TTCCTCCACT TGCAATAGCT ATTTCAACTA CTGTATTTAA GAATAAGTAC 
AATAAGGAAG AAAGAGAAGC AGGACTTTCA AATTATATAA TGGGGATTTC ATTTATAACA 
GAGGGGGCAA TACCATTTGC AGCTGCAAAT CCTTTAAGAG TATTACCTGG AGCAATAATA 
GGTGCAGCAA TTTCAGGAGC TTTAACTATG TTATTTAATA TTAAAATACC AGCTCCTCAT 
GGAGGAATAC TTGTAATGTT CTTAAGTTCT AACTTCTTCT TATACTTACT TGCAATAGTA 
ATAGGTTCTA TAGTGGGAGC AATTATTTTA GGGCTTTTAA AAGAAAAAAG ATAA

Protein sequence

MKLTELLREN QVIFNLNADN KKDAIIEMAK VFKPDVINDQ EKFIEDLFAR ESLSHTALEL 
GVATPHAKSR GVSKPALVIA IKKEGIDFSE GQEDKSKLFF MIAVPENEGN LHIDILTKLA 
DVMLDNDKLN ALLNSTSYDE VIDIIEKEKI MENKESEKFV VAVTACPTGI AHTFMAKDAL 
IKAAKELGVN IKVETNGTNG RKDEITKEDL EKASGVILAI NKSVNEERFN GYKVIKVGAK 
DGINKAKELI LDTLSGKGTI ANFESSGNST FMNNGKKGMY NHLMSGVSYM LPLVISGGIL 
IALAFLFDSL AGNSNVGGGF GSTSKLAATF MQIGGAAFGL FVPILAGYVA YSIGEKSSLA 
AGLVAGALAS SGGSGFLGAL VGGLFAGYVT KFYSKVTSNI KKQLQGINLI LFTPVITVLL 
TGLVMLFLLN PMVSGINTGI TNFLESMSAS SRILLGALLG GMMAVDMGGP VNKAAYVFGT 
GTLAATVSTG GSSAMAAVMA GGMVPPLAIA ISTTVFKNKY NKEEREAGLS NYIMGISFIT 
EGAIPFAAAN PLRVLPGAII GAAISGALTM LFNIKIPAPH GGILVMFLSS NFFLYLLAIV 
IGSIVGAIIL GLLKEKR