Gene Smon_1041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smon_1041
Symbol
ID	8600769
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptobacillus moniliformis DSM 12112
Kingdom	Bacteria
Replicon accession	NC_013515
Strand	-
Start bp	1129738
End bp	1131558
Gene Length	1821 bp
Protein Length	606 aa
Translation table	11
GC content	26%
IMG OID
Product	DNA mismatch repair protein MutL
Protein accession	YP_003306381
Protein GI	269123804
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGAAG TGATAAATAT GGCTCTTATA AAAATATTGG ATGATAGTAT TTCAAATATT 
ATTGCAGCTG GAGAAGTAGT AGAAAATCCA GCGAGTATGA TAAAAGAACT TCTTGAAAAT 
TCATTAGATG CAGAGGCAAG CTCTATACAA ATAGAAGTAT TAAATGGTGG AATATATGTA 
AAAATATCAG ATAATGGAAA AGGTATGAGT AGAGAAGATG TTATTTTAAG TATAGAAAGG 
CATGCTACTT CTAAGATATC GACTAAAGAA GATATATTTA ATTTACAAAC ATATGGATTT 
AGAGGAGAAG CTCTAGCTTC AATTGCAGCT GTTTCAAAAA TTTCAATTAG CAGTAAAACA 
AAAGATGAAA AAATTGGAAC AATAGTTAAT GCATATGCTG GAGTAGTTAG AAAGTATGAA 
AATTTTACTA GAACTACAGG AACAGAGATA GAAATAAGGG ATTTATTCTA TAACACACCA 
GCTAGAAAAA AGTTTTTAAG AAAAGAAAGC ACAGAATATA GTAAGATTAA AGACATAGTT 
CTTAAAGAGG CTCTTGCTAA TCCAAATGTA GCCATAACCC TATATATAGA TGGAAAAGCT 
ACTTTAAAAA CCACTGGTAA TGGTATGGAA AATACAATTT TTGAACTTTT CGGTAAAAAT 
GTTCTTAAGA ATTTAGAAAA ATTTGAATAT GGATATTTAG GAAATGTTGA AATTTTAAGG 
TCATCAAAGG AATACATATA TACTTATGTT AATGGTAGAT ATGTTAAATC CAATTTACTA 
GATAGAGCAG TTATAGATGC ATATTATACT AAATTAATGA AAGGTAAATA TCCTTTTGTA 
ATATTAATGT ATGATGTAAA TCCTAAAGAA ATAGATGTTA ATGTACATCC AAGTAAGAAA 
ATGATAAAAT TTTCTGATGA AAAGATAGTG TATAATGATA TTAAAAGATC TATTGATAAT 
TTCTTTTATG AATTTGATAG AAGAACTTGG CAACCTACAT TAATACCAAA AACTAATGAA 
GTAGTTGTAG ATAATACAGA AACAGAATAC ATACCTATAA ATATTTTTTC AAAAGATGAG 
GTAAAAGAAG AAGTTATTCC TGAAACTTTA ACTTTTAAAG AAGAAAAAGA TTTAGAAGTA 
AGAGAACCTA AATTAATATA TGAAAATCCT TTTTATGAAG AAGAGGAAGA AATTAAAGTA 
GAAAATAAGG TGGAATACTT AAAACCATTT TTTGAGAAAA AAGAAGGGGA AGTAAAATAT 
TATGAAGTAT TAGGTCAAAT ATTTGATACA TATATATTAG TTAATAGAGA TAATAATTTA 
GAAATATATG ATCAACATAT TATACATGAA AGACTGCTTT ATGAAGAACT TATGTCTAGT 
TTTGAGAAAA AGAATATTGG TTCTCAAATA CTTCTTTTAC CTGAATTAAT AGATGTTAGT 
CCAGTTGATA AAGATATCAT ATTTAATAAT ATGGACACAT TTGAAAAACT TGGTTTTGAA 
ATTGATGAAA TTTCAAATAA TCAAATAGCT TTAAGAGCAG TACCTAATTT TAACTTTAGA 
GAAAGTATAA AAAATATTTT AGAGAATATA TTAGTTGATT TAAAGAGTAA AAATAAGGTT 
GGAGATATTA GAGAAAAAAT AATAATATCT ATGTCATGTA GAGGAGCTAT TAAAGCGGGG 
CAAAAATTAA ATATGCAGGA AATGCAAAAT ATGGTAAGAA GATTACATGA AGTAGGTAAG 
TATACTTGCC CTCATGGAAG ACCTATTATA TCAAAAATAT CTAAGTATGA TTTAGATAAA 
ATGTTTGGTC GTGTGAAATA A

Protein sequence

MKEVINMALI KILDDSISNI IAAGEVVENP ASMIKELLEN SLDAEASSIQ IEVLNGGIYV 
KISDNGKGMS REDVILSIER HATSKISTKE DIFNLQTYGF RGEALASIAA VSKISISSKT 
KDEKIGTIVN AYAGVVRKYE NFTRTTGTEI EIRDLFYNTP ARKKFLRKES TEYSKIKDIV 
LKEALANPNV AITLYIDGKA TLKTTGNGME NTIFELFGKN VLKNLEKFEY GYLGNVEILR 
SSKEYIYTYV NGRYVKSNLL DRAVIDAYYT KLMKGKYPFV ILMYDVNPKE IDVNVHPSKK 
MIKFSDEKIV YNDIKRSIDN FFYEFDRRTW QPTLIPKTNE VVVDNTETEY IPINIFSKDE 
VKEEVIPETL TFKEEKDLEV REPKLIYENP FYEEEEEIKV ENKVEYLKPF FEKKEGEVKY 
YEVLGQIFDT YILVNRDNNL EIYDQHIIHE RLLYEELMSS FEKKNIGSQI LLLPELIDVS 
PVDKDIIFNN MDTFEKLGFE IDEISNNQIA LRAVPNFNFR ESIKNILENI LVDLKSKNKV 
GDIREKIIIS MSCRGAIKAG QKLNMQEMQN MVRRLHEVGK YTCPHGRPII SKISKYDLDK 
MFGRVK