Gene Smon_0126 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smon_0126
Symbol
ID	8599824
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptobacillus moniliformis DSM 12112
Kingdom	Bacteria
Replicon accession	NC_013515
Strand	+
Start bp	134985
End bp	136388
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	28%
IMG OID
Product	sulfatase
Protein accession	YP_003305496
Protein GI	269122919
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAAGA AATATAACTT AATTTTTCTT TTTGCAGATC AATGGAGAAG AAATGCAGCA 
GGTTTTGTAG GAACAGAAGA TGTAATTACA CCTAATATAG ATGAATTTTC TAAAGAATCA 
TTAGTTTTTA CTAATGCTGT GAGTACAGGG CCTTTATGTT CTCCGAGTAG AGCAAGTATA 
CTTACTGGTA CATATCCAGC AACTCATGGG GTATGGACTA ATTGTAAAAC AGGACTATAT 
GATGTATGGT TAAAAGAAGA ATCAATAACA ATAACAGATG TATTAAAAGA AAATGATTAC 
TATATAGGAT ATATAGGGAA ATGGCATTTA GATAATCCTG AAGAAAATGT TGAAGAAAAA 
CCAAAATCAG GTGCTAGAGA TTGGGATGCC TATACTCCAC CAGGTAAAAA AAGACATGGT 
ATAGATTATT GGTATTCATA TGGAGCATAT GATAATCATT TAAAACCACA TTATTGGGAA 
AATAGTCATA ACATGATAGA AATAGATAAG TGGTCAGTTG AGCATGAAAC AGATAAAGCT 
ATAGAATTTT TAGACAAGAA TAAGGATAAT CCATTTGCAC TATTTTTATC ATGGAATCCA 
CCTCATACAC CACTTGATTT AGTTCCTGAA AAATACATTG ACCTTTATAA GGATAAAAAA 
TTAAGAGTAA GTGATAATGT AATATTAAAT AATGTAATAG ATCATACAGA ATCTATGCCT 
GAAGCCCTTA ATTTTACTGA AGATGGATTT CAAGATGCAT TAAGAAAATA TTATGCTGCA 
ATAAGTGGTA TAGATGAACA TTTTGGAAGA TTAATAGATT ATTTAAAAGA AAATAATATA 
TATGAAAATA GTATAATAGT TCTTACAGCA GATCATGGAG AAATGTTATG TTCTCATGGG 
CTGTGGAGTA AACATGTATG GTATGAAGAA TCTATAGGTG TTCCATTTAT GATTAAATTT 
GGTGATAATA GAGGAATTAC TGAAAGTGTA TTAAGTGGAG TAGATATTAT GCCAACCTTA 
TTATCATTAT TAGATTTAAA AATACCAAAA ACTGTTGAAG GAAAAGATTT AAAGGAAGTA 
ATAATTAATT TAGAAGAAGA TTTAGAAAAT AAAGCAATAA TTGCAGCATA TCCTGGTCAA 
ATAAAGGCTA TAGAAAAATT CAAAAAAGAG AATTTAAATA ATCTTGATTT TGGTTGGAGG 
GCAGTTAAAA GCAGAGAACA TACTTTTGTA ATTAATAAAG GGTATGAACC TGGAAGAGAT 
ATAGAAACTT TACTATATGA TAATGTAAAA GATATATATC AACTTAATCC TAAAATTATT 
AAAAATATCA GTGAAGATAA AATTGCAAGC AAGTTAAATG CTATTTTACA GAAGTGGTTA 
AAAGAACATA ATGATGGATT TTAA

Protein sequence

MNKKYNLIFL FADQWRRNAA GFVGTEDVIT PNIDEFSKES LVFTNAVSTG PLCSPSRASI 
LTGTYPATHG VWTNCKTGLY DVWLKEESIT ITDVLKENDY YIGYIGKWHL DNPEENVEEK 
PKSGARDWDA YTPPGKKRHG IDYWYSYGAY DNHLKPHYWE NSHNMIEIDK WSVEHETDKA 
IEFLDKNKDN PFALFLSWNP PHTPLDLVPE KYIDLYKDKK LRVSDNVILN NVIDHTESMP 
EALNFTEDGF QDALRKYYAA ISGIDEHFGR LIDYLKENNI YENSIIVLTA DHGEMLCSHG 
LWSKHVWYEE SIGVPFMIKF GDNRGITESV LSGVDIMPTL LSLLDLKIPK TVEGKDLKEV 
IINLEEDLEN KAIIAAYPGQ IKAIEKFKKE NLNNLDFGWR AVKSREHTFV INKGYEPGRD 
IETLLYDNVK DIYQLNPKII KNISEDKIAS KLNAILQKWL KEHNDGF