Gene Smon_1071 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smon_1071
Symbol
ID	8600799
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptobacillus moniliformis DSM 12112
Kingdom	Bacteria
Replicon accession	NC_013515
Strand	-
Start bp	1178818
End bp	1179993
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	25%
IMG OID
Product	DNA methylase N-4/N-6 domain protein
Protein accession	YP_003306410
Protein GI	269123833
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAATAA ATGATATATA TAATTTAGAT TGTTTAGATG GAATGAGAAA TATGTATGAT 
GAAACTATAG ATCTTATATA TTTAGATCCT CCATTTTTTA CTCAAAGAAA ACATAAATTA 
AAGAGTAAAG AAGGTATTGA ATATGAATTT AATGATATTT GGAATGATAT AGAAGAATAT 
AAGGAATATT TGAGGATAAG ACTTGTTGAA ATGAAGAGAG TTTTAAAAAA TGATGGTAAT 
ATTTTTGTCC ATTGTGATAA TAATGCAAGT CATATAATAA GGTTATTATT AGAAGAAATA 
TTCGGAGTAA GTAATTTTGT AAGTGAAATT ATATGGACAT ATAAAAGGTG GAGTAATTCT 
AAAAAAGGTC TTTTAGATTC ACATCAAAAT ATTTATCATT TCTCAAAATC AAAGGAGTAT 
AAATTTAATA TTATTTATAC GGATTATTCA CCTACTACAA ATGTAGATCA AATTCTTCAA 
GATAGAATTA GAGATGGAAA TGGAAAAAGT ATATATAAAA GAGATGAAAA TGGTAAGGTT 
GTATATAATA GAATAAAAAA AGGAGTTCCA TTAGGAGATG TTTGGGAAAT ACCATTTTTA 
AATCCTAAAG CTAAAGAAAG GGTTGGTTAT CCAACACAAA AACCTATACA ATTACTTGAA 
AATATATTAA AAATTGCTTC TAATGAAGGA GATATTGTAT TAGATCCATT TTTAGGAAGT 
GGAACTTGTG CTGTAGCATC TAAATTACTT AATAGGAGAT ATATAGGCTT TGATATTAAT 
CCTAATGCAA TAAGTATAGC TAAATATAGA TTAGAATATC CAATCAAGAC AGAATCTGCT 
CTTTTAAAAA ATGGAATAGA TAAATATGAT GTTAAAACTG ATAGAGAAAA AAGAATACTT 
AGTAGATACG ATTGTGATAT AGTTCAAAGA AATAAGGGTT TAGATGGAAT ATTAAGAGTA 
AAAATTGATG ATAAACTTGT GGGAATAAAA ATACAAAAAG ATAATGAAAC ATTGAGTGAT 
AGTGAACAAA ATTTACAAAT TGCTATGAAA AAGAAAAATT TAGGCTTGGG AATTTTAATT 
AGAACTCATA AAGATTTGAT GGAACATAAT GTTGAAAATA ATATAATTCT TATTGATGAT 
ATAGAATACC ATATAGAAAA AACTAACAGG GATTAA

Protein sequence

MQINDIYNLD CLDGMRNMYD ETIDLIYLDP PFFTQRKHKL KSKEGIEYEF NDIWNDIEEY 
KEYLRIRLVE MKRVLKNDGN IFVHCDNNAS HIIRLLLEEI FGVSNFVSEI IWTYKRWSNS 
KKGLLDSHQN IYHFSKSKEY KFNIIYTDYS PTTNVDQILQ DRIRDGNGKS IYKRDENGKV 
VYNRIKKGVP LGDVWEIPFL NPKAKERVGY PTQKPIQLLE NILKIASNEG DIVLDPFLGS 
GTCAVASKLL NRRYIGFDIN PNAISIAKYR LEYPIKTESA LLKNGIDKYD VKTDREKRIL 
SRYDCDIVQR NKGLDGILRV KIDDKLVGIK IQKDNETLSD SEQNLQIAMK KKNLGLGILI 
RTHKDLMEHN VENNIILIDD IEYHIEKTNR D