Gene CPR_1172 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1172
Symbol	mutL
ID	4203971
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	+
Start bp	1320753
End bp	1322777
Gene Length	2025 bp
Protein Length	674 aa
Translation table	11
GC content	28%
IMG OID	642565728
Product	DNA mismatch repair protein
Protein accession	YP_698494
Protein GI	110801747
COG category	[L] Replication, recombination and repair
COG ID	[COG0323] DNA mismatch repair enzyme (predicted ATPase)
TIGRFAM ID	[TIGR00585] DNA mismatch repair protein MutL

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAATAGAA TAAATATTTT AAATGCAGAT ACAGCAAATA AAATAGCAGC AGGAGAGGTT 
GTTGAAAGAC CTTCTTCTGT GGTTAAAGAA CTTGTAGAAA ATTCATTAGA TGCAGGGGCA 
AAAAATATAA CTATAGAGAT TCAAAATGGT GGAGAATCTC TTATAAAAAT AATAGATGAT 
GGCTCAGGAG TTCATCCAGA GGATGTTGAA AAAGCTTTTA ATCCTCATGC TACAAGTAAA 
ATAAAAGATA CTTATGATAT ATTTAGTATA AATACCCTTG GATTTAGAGG AGAAGCTTTG 
CCTAGTATAG CTTCTATTGC AAGGGTTGAT TTTAAAAGTA AAACAGAAGA CTTTGACATG 
GGTAAAGAGC TAATAATTAG TGGGGGAGAA AAAGAATCTT TAACAGATTG TTCTATGAAT 
AGAGGAACTC AAATAGAAGT TAGGAATTTA TTCTTTAATG TACCTGCTAG AAAGAAATTT 
TTAAAGACAA CAGCTAGAGA AAGTGCATTA ATAAATGACT TAGTAAACAG AATTTCATTA 
GCTAACCCAG ATGTATCATT TAAATTATTT AACAATAATA AAAAGATTTT AAATACTTAT 
GGCAATGGAA AATTAATAGA TGTTATAAGA ACTATTTATG GTAAGTCCAC TGCTGAAAAT 
TTAATATATT TTGAAGAGCA TAAGGATACA GCTTCTGTTT ATGGATTTAT AGGAAATGAT 
ACCTTAGCAA GAGCATCTAG AAATAATCAA AGTCTTTTTG TAAATAAGAG ATATGTAAAA 
AATAGAAGCT TAACTGTAGC TGTGGAAAAT GCCTTTAGAT CCTTTAACGT TACAGGTAAG 
TTTCCATTCT TCGTATTATT TATAGATACT TATCCAGAGC TTATAGATGT TAACATACAT 
CCAACAAAAT CTGAAATTAA ATTTAAAGAT GAACGTTTTA TATTCAAGTT AGTCTTTGAT 
GCTGTTCATT CAGCTATGAG GGAATATGTA AAAGACACCT TTACTCTTCC AGAAGAAGAG 
GAGAAAAAAT TTGAAGCTTT AAAAGAAGAA GTTATTCAGG AAAGCTTAGA TAAGGAAATA 
AGTACCTTAG AAAAGTTAAA AGAAAATATA AATTATAAGG TAAGCGATGA TAAAAGAAAA 
GAAGAGATTT ATTCTTATAA TCCTTCTAAG GATTATGAAG CTAAAACAGA GGTTAATATT 
CCAGTAGATT TCTTATCAAA AGAAAATCAG GAGGAATCTT CTAAGTTTAA TAACTCTTTA 
GAAAATAATG ATTTTAAAGA GGTTTCAGCT AAAAGAGAGA TTTCTTATGA TCCTATACTT 
ATAAAAAATG AACTTAAAGA TAAAGTAAGT GAAAATACTT ATGATTCACT TGAATCAAGT 
GATTATAAAT GTAATAAGAA TGAATATGGA AATTCCCTAG AGGAAAGAAT TTATAGGGAA 
GCAAAATTCC CTAAGCTAAA AGTTATTGGT CAATTTAATA AAACCTATAT ATTAGCTGAG 
TATGATTCTA CTTTATATTT AATAGACCAA CATGCAGCTC ATGAGAAGAT TTTATTTGAA 
AAGTATTCTT CAGATATAGC TAAAAAGAAG GTTGAAATTC AACCTCTAAT GATTCCACTA 
GTAGTAACAT TGCCTACAGA GGATTATCTT TATTACGATG AAAATAAAGA GATTTTTGAA 
AAGGCAGGAT TTAAAATAAG TGATTTTGGT GATAATTCTA TAAGAATTGA AGAGGTACCA 
TACTTTTTAG ATAAATTAAA TCCAACAGAG CTAATAATAT CTATGATAAA TAACTTAAAG 
AAAATGGGTA CTGGAGAAAC TGTAGAGGTT AAATATAATA AAATAGCATC TATGTCCTGT 
AGGGCGGCAG TTAAGGCTAA TGATGTTTTA AGCATACTAG AAATGGAAAA CTTAATAGAA 
GATTTAAGAT ATATAAATGA TCCTTTTCAC TGTCCACATG GACGTCCAAC CATAATTAAA 
TTTACTAGTT ATGAATTAGA TAAGAAGTTT AAAAGAATAA CTTAA

Protein sequence

MNRINILNAD TANKIAAGEV VERPSSVVKE LVENSLDAGA KNITIEIQNG GESLIKIIDD 
GSGVHPEDVE KAFNPHATSK IKDTYDIFSI NTLGFRGEAL PSIASIARVD FKSKTEDFDM 
GKELIISGGE KESLTDCSMN RGTQIEVRNL FFNVPARKKF LKTTARESAL INDLVNRISL 
ANPDVSFKLF NNNKKILNTY GNGKLIDVIR TIYGKSTAEN LIYFEEHKDT ASVYGFIGND 
TLARASRNNQ SLFVNKRYVK NRSLTVAVEN AFRSFNVTGK FPFFVLFIDT YPELIDVNIH 
PTKSEIKFKD ERFIFKLVFD AVHSAMREYV KDTFTLPEEE EKKFEALKEE VIQESLDKEI 
STLEKLKENI NYKVSDDKRK EEIYSYNPSK DYEAKTEVNI PVDFLSKENQ EESSKFNNSL 
ENNDFKEVSA KREISYDPIL IKNELKDKVS ENTYDSLESS DYKCNKNEYG NSLEERIYRE 
AKFPKLKVIG QFNKTYILAE YDSTLYLIDQ HAAHEKILFE KYSSDIAKKK VEIQPLMIPL 
VVTLPTEDYL YYDENKEIFE KAGFKISDFG DNSIRIEEVP YFLDKLNPTE LIISMINNLK 
KMGTGETVEV KYNKIASMSC RAAVKANDVL SILEMENLIE DLRYINDPFH CPHGRPTIIK 
FTSYELDKKF KRIT