Gene Smon_0357 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smon_0357
Symbol
ID	8600066
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptobacillus moniliformis DSM 12112
Kingdom	Bacteria
Replicon accession	NC_013515
Strand	+
Start bp	418366
End bp	419841
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	28%
IMG OID
Product	sulfatase
Protein accession	YP_003305718
Protein GI	269123141
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAA ATAATATTTT ATTTATTATT GCAGATGATT TAGGAGCATG GGCATTAGGT 
TGTTATGGAA ATAAAGATGC TATAACTCCT AATATTGATA TGTTAGCAGA AAAAGGTAAA 
ATATTTGAAA ATTTCTTTTG TGTTTCCCCT GTTTGTTCTC CTGCAAGAGC TTCAATTTTT 
ACAGGAAGAA TACCATCACA ACATGGTATA CATGATTGGC TTGATGAATG GGAAAATGGA 
ACAACAACTG AAGATTATTT AAAAGGACAG TCTACATTTG TAGATGTTTT ATCAAAAAAT 
AACTATATTT GTTGTATGAG TGGTAAATGG CATATGGGAC TTGCAGATGT TCCTCAAAAA 
GGGTTTCATT ATTGGTATTC ACATCAAAAA GGCGGTGGAC CATATTACAT GGCACCTATG 
TATAAAGATG GGAAACTAAT ACATGAAGAA GAATATATAA CTGATAAAAT AACTGAATAT 
GCTATAGATT TTTTAGATGA TGTTTATAAA GAAGATAAAC CTTTCTTTTT AAATGTTAAT 
TATACTGCTC CTCATTCACC ATGGGATAAA AAAAATCACA AAGAAGAAAT TTTAAAACTT 
TATGAGGGTT GTAAATTCAA ATCTTGTCCA AGAGATCCAT ATCATCCTTG GAAAATATCA 
GAAACATTTG AAGGAAATGA AGAAGAAAGA ATACAAATAC TTAAAGGATA TTTTGCAGCC 
CTAACTTCTA TGGATTTTGG TATAGGAGAA ATAATTAAAA AACTTGAAGA AAAAGATATG 
CTTAAAAACA CCCTTATAAT ATTTACAAGT GATAATGGTA TGAATATGGG GCATCATGGT 
ATTTTTGGTA AAGGAAATGG AACAAGTCCT TTAAATATGT ATGATAGTTC TGTTAAAGTC 
CCTTTTATAA TATATAAAAA AGATGAAACA GAAGCAGAAA AAGTAAATAA TCTATTAAGT 
CATTATGATG TTAGATCTAC ATTACTTGAA TATTTAGGAT TAGATGATGT AAAAGATGAA 
AACATTGATT ATCCTGGTAA TAGTTTTTCA GAGATACTTA ATAATAAGAA AATAGATGAT 
GATAAAAATG TTGTAATATA TGATGAATAT GGTCCAACTA GAATGATTAG AAATGAAAAA 
TATAAATATG TTCATAGATA TCCTGATGGA CCTCATGAAT TTTACAATTT AATAGAAGAT 
GTAGAAGAAA AAGTAAATGA AATTAATAAT GAGAAATATA GTAAAATTAT AGATCAAATG 
AGAAAAGACC TTGAAATATG GTTTTTAAAT TATGTTAATA AAGAAATTGA TGGAGCTACA 
CTGCCTATTT ACGGTGCAGG TCAGAAAAAG TTTGCAGGTA AATGGGGAGG TTATGCAAAA 
GATACTTTTG GAAGATATCA TTCAAAATTC ATATTTTCAT CTGATGCTAA GTTAAATGAA 
GATGAAAAAA TAGAAATAGA AAATAAAATA CAATAA

Protein sequence

MKKNNILFII ADDLGAWALG CYGNKDAITP NIDMLAEKGK IFENFFCVSP VCSPARASIF 
TGRIPSQHGI HDWLDEWENG TTTEDYLKGQ STFVDVLSKN NYICCMSGKW HMGLADVPQK 
GFHYWYSHQK GGGPYYMAPM YKDGKLIHEE EYITDKITEY AIDFLDDVYK EDKPFFLNVN 
YTAPHSPWDK KNHKEEILKL YEGCKFKSCP RDPYHPWKIS ETFEGNEEER IQILKGYFAA 
LTSMDFGIGE IIKKLEEKDM LKNTLIIFTS DNGMNMGHHG IFGKGNGTSP LNMYDSSVKV 
PFIIYKKDET EAEKVNNLLS HYDVRSTLLE YLGLDDVKDE NIDYPGNSFS EILNNKKIDD 
DKNVVIYDEY GPTRMIRNEK YKYVHRYPDG PHEFYNLIED VEEKVNEINN EKYSKIIDQM 
RKDLEIWFLN YVNKEIDGAT LPIYGAGQKK FAGKWGGYAK DTFGRYHSKF IFSSDAKLNE 
DEKIEIENKI Q