Gene Smon_0117 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smon_0117
Symbol
ID	8599815
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptobacillus moniliformis DSM 12112
Kingdom	Bacteria
Replicon accession	NC_013515
Strand	+
Start bp	122992
End bp	124848
Gene Length	1857 bp
Protein Length	618 aa
Translation table	11
GC content	24%
IMG OID
Product	Hyaluronate lyase
Protein accession	YP_003305487
Protein GI	269122910
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATGAGT TATTATTAAA AAGAAGAGAG TATTTAATAG GAAATTTTAA GGATTTACCA 
TTAAATAAGA GAAAACAAAT AGAAGAAATA CAAGAGAAAA ATATAGAAAA ATTAGAATAT 
TTAGAAAATT TAAACATAGC TGAGGTAAAG TTAAAATACA ATAATATATT AGAACTTGCT 
AAGGCATATA ATCAGGTTGG AAATGTTAGA TATAGGGATG AAAAAATTAA AGTCATTATA 
CTTAAAACAT TAAAATTATT AAGAATAACT TACTATAACC TATCATCAGT AGAGAAAGTA 
AATTGGTGGC AATGGGAAAT AGGAATACCT TTATTACTAA ATGATATATT TATATTAATG 
AATGAAAAAG ATTTTGATTT TGAAAAAGAA GAAAATTTAA AAACTAGTAT ATATTTTCAA 
AAAGATCCAA GGTATTCAGG TAATAATCCT GTGGCGACAC ACCCAAGTAA AAAGCCTTTT 
AGAATATCTA CGGGTGGAAA TAGAGTTGAT ACAGTTAAAG TATCATTATT TCGATCCATA 
TTATTAAATA ATGAAGAGGA ATTGAAACTT GCTCTTAATT CACTTCCAGA AGTTTGGAAA 
TGTAGAGAAA AAATAAATAG GATAGAAACC GATACACAAA GAGATGGCTT CTATAATGAC 
GGCTCATTTA TTCAACATGG AAGTTTAGCT TACAATGGAA CATATGGTAA TGTCTTATTA 
CAAGGTATAG GAGAAATACT TTATGTTATA GGGGATAGTA AATATTTAAA ATATCTTGGA 
GATATATATA GCTTGAAAGA TATAATACTT AATAGCTATA AGCCATTTAT GTATAAAGGT 
TCATTCCCTG ATATGTTAAA TGGTAGAGCT ATTACAAGAG AAAATTCATC TGATAAAACT 
ATAGGGCATA TGTTATTAAA TTCTATAATG CTAATATCAT GTGGTTTAAA TGATGAAGAA 
TTAAAAAATT TAGTTGCAAG TGAAATATTA AAATATGAGG ATTATTCATA TTTTGATAAA 
GAACTTTCAC CTTTTATGTA TGATTTAGTT AAAAAAAATA TACATAATAG GAAAAAAGAA 
GAATATGGAA AGATAATAAA AGTCAGTAAT ATTATGAATA GGGTCTTTAT TAAAGATGAC 
AAAAAGGCTA TAGCTATTGC AGGTCATAGT GAAAATATAT CAAATTATGA AAGCATTAAT 
GGTGAAAATA CAAAAGGTTG GTATACAGGA GATGGGATGA TATATCTCTA CACTAGTGAT 
GTAACATATA CCAATTATTG GAATAATTCC GACACGCGAT ATATGTCAGG AACTACAGAA 
GTTTATGAAG ATTTAAATGG TATAAATACA TCACAGATTT TAAATGTGAA TATGAGTAGT 
GCCAAGATAG TTAAAGCCAT AGAAAAAGAT AATAAGATGA TATTTTTTAT GGAATTTGAA 
AATCATAATA AGAGTTTAAA AATGTATAAA TCATATGTAT ATACAGGTAA GAAACTTATT 
TGTTTAAACA CAAATATTGA TACAAAAGAA AAGATATATA CAACAATTGA CAATAGGCTA 
TATAAAGAAA AACCTAAAAT TGTAATGGAA GATAAAAGGA TATTAATTAA TGATTTAATA 
TTTAATATAA TTACAGATCA TAAATTTAAT TTTGATATAA AAGAAAGTGA ATTTGGATAT 
TTTGTAAAAA TATGGATAGA ACATAAATAT AATGAAAATT TGTATTATGA AATAATATTT 
GAATATGATG ATAAAACATC ACTAATAGAG GATAATAAAG AAAATATAAT AATAAGAAAT 
GGTAATGAAA AATATTTAAT AAATACAAAA GAGAAAGAGG TGTTGAGATT TGAATAA

Protein sequence

MYELLLKRRE YLIGNFKDLP LNKRKQIEEI QEKNIEKLEY LENLNIAEVK LKYNNILELA 
KAYNQVGNVR YRDEKIKVII LKTLKLLRIT YYNLSSVEKV NWWQWEIGIP LLLNDIFILM 
NEKDFDFEKE ENLKTSIYFQ KDPRYSGNNP VATHPSKKPF RISTGGNRVD TVKVSLFRSI 
LLNNEEELKL ALNSLPEVWK CREKINRIET DTQRDGFYND GSFIQHGSLA YNGTYGNVLL 
QGIGEILYVI GDSKYLKYLG DIYSLKDIIL NSYKPFMYKG SFPDMLNGRA ITRENSSDKT 
IGHMLLNSIM LISCGLNDEE LKNLVASEIL KYEDYSYFDK ELSPFMYDLV KKNIHNRKKE 
EYGKIIKVSN IMNRVFIKDD KKAIAIAGHS ENISNYESIN GENTKGWYTG DGMIYLYTSD 
VTYTNYWNNS DTRYMSGTTE VYEDLNGINT SQILNVNMSS AKIVKAIEKD NKMIFFMEFE 
NHNKSLKMYK SYVYTGKKLI CLNTNIDTKE KIYTTIDNRL YKEKPKIVME DKRILINDLI 
FNIITDHKFN FDIKESEFGY FVKIWIEHKY NENLYYEIIF EYDDKTSLIE DNKENIIIRN 
GNEKYLINTK EKEVLRFE