Gene CPR_2123 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_2123
Symbol
ID	4204405
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	2351412
End bp	2353199
Gene Length	1788 bp
Protein Length	595 aa
Translation table	11
GC content	27%
IMG OID	642566673
Product	MutS domain-containing protein
Protein accession	YP_699432
Protein GI	110801595
COG category	[L] Replication, recombination and repair
COG ID	[COG0249] Mismatch repair ATPase (MutS family)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGAATA GAAAAGATAT TTATGAAAAA AGAATAGAAG AGTATTCAAG TGCTTTAAAG 
AGATTAAAGA GAGACTATAA TATAATCAGC GCATTAAGAT TAGTAGTTTC TTTAAGTATT 
TTATTTTTTA TTTACTACGC TTATAGCATA GGCTCAATAA GCTTTGGGAT CATATTATTT 
TTGCTAAATT CTATATTATT TTTATATTTA GCAAAGGTTC ATGAAGGTAT AGTGAATAAA 
ATAAGTAAAA GAGAAGCTCT TATAGAGGTT AATAAAAAAG AGATTCTTAG GTTAGAGGGA 
AAGTGGAGAG AATTTAATGA TTTAGGAGAA GAATATTTAG ATAATAAGCA TCCTTTTATA 
AATGACTTAG ATATATTTGG GAAAAACTCT TTATTTCAAT GGATAAATGA AACTGGTACT 
GTTTATGGAA GAGAGAAATT AAGCCATTTA TTAAAGTTAG AAGAACTTCC AAATAAAGAA 
GAAATTTTAT TAAGACAGGA AGCTTTAAAG GAGCTTTCTA AAAAAGTAGA TTTTAGACAT 
GAATTTATAG CTTCATTAAA AGATAAAAAA GGAAAAAAAG AGAAGTATTT AGGGGAATGG 
TTAAAAGAAG ACAGTAAAGC CATATCGCCT TTATTAAATA TTCTTAGAAT AATAATGCCA 
GTAATAAATA TTGGAATTAC TATTTTAGTT GGTATGAATG TTATTTCATG GCAAATACTA 
TTAATTTCTC TTGTTATAAG TTATGGTATT TTGAAGCTTG GCAATAAGGA AGTTATTAAA 
GGATTAAATA TATTTGAAGA TTTAAAATAT AGAATAAAAA CCTATGTAGA GGCTTTAGAG 
TTAATAGAAA AAGAGAATTT CCAGTCTAAT ATAATAAAAA GTATAAAAAG TAACTTAGAT 
ATGAATGGCA AAAGTGCTAG TAAGGAGCTT AAAAGCTTAG AAAAGATAAC TAGCTGGCTT 
TATGATAGGG GAAATGCCTT TTATCTTTTA TTAAACTGTT ATTTGCTTTG GGATTATCAA 
ATTCTATCAA AGCTTGAAAA GTGGAAGAGT TCTAATAAAG ATGAGTTTTA TAAATGGATG 
ATTTCTTTAG GTGATTTTGA GGCTTTAGTT TCTTTAGCTG GATTTACTTA CAATAATCAT 
GGATGGGCTA CACCAAAAAT AAATGATGAC TATACTTTAA AGGGAAAAAA TCTTAGCCAT 
CCTATGTTAG GAGAAAAAGG CGTTGGAAAC AGTTTTGATA TTAATAAGGA TAAGAGAGTA 
ATCTTAATAA CAGGATCTAA TATGTCAGGT AAGAGTACAT TTTTAAGAAC TGTTGGATTT 
AATTGTATAT TAGCTTATCT AGGACTTCCT GTAAAAGGAG AAAGTTTTGA AGCTCCAATA 
TTAAAAGTTT ATACCTGTAT GAGAACTGGA GATAATCTTG AAGAGAGTAT ATCTTCATTT 
TATGCAGAGA TACTTAGAAT AAAGATTATA GTTGAGGGTG TAAAAAGAGG AGAAAAGATT 
TTATTTTTGT TAGATGAAAT ATTTAAAGGA ACAAACTCCT TAGATAGACA TGAGGGAGCG 
GAGATATTAA TAAATCAGCT TTTAGAAGGA AACACATTAG GATTAGTTTC AACTCATGAT 
TTTGAACTTT GCGATATGGA GAAAAAAGAT TCTACTATAC AAAATTATAA TTTTAGAGAA 
TATTATGAGG ATAATAAATT AAAGTTTGAT TATATTTTAA GAAAAGGTGT TTCACAAACA 
AGAAATGCTA GATATTTAAT GAAGATGGCT GGAATAGATA TTGAATAA

Protein sequence

MENRKDIYEK RIEEYSSALK RLKRDYNIIS ALRLVVSLSI LFFIYYAYSI GSISFGIILF 
LLNSILFLYL AKVHEGIVNK ISKREALIEV NKKEILRLEG KWREFNDLGE EYLDNKHPFI 
NDLDIFGKNS LFQWINETGT VYGREKLSHL LKLEELPNKE EILLRQEALK ELSKKVDFRH 
EFIASLKDKK GKKEKYLGEW LKEDSKAISP LLNILRIIMP VINIGITILV GMNVISWQIL 
LISLVISYGI LKLGNKEVIK GLNIFEDLKY RIKTYVEALE LIEKENFQSN IIKSIKSNLD 
MNGKSASKEL KSLEKITSWL YDRGNAFYLL LNCYLLWDYQ ILSKLEKWKS SNKDEFYKWM 
ISLGDFEALV SLAGFTYNNH GWATPKINDD YTLKGKNLSH PMLGEKGVGN SFDINKDKRV 
ILITGSNMSG KSTFLRTVGF NCILAYLGLP VKGESFEAPI LKVYTCMRTG DNLEESISSF 
YAEILRIKII VEGVKRGEKI LFLLDEIFKG TNSLDRHEGA EILINQLLEG NTLGLVSTHD 
FELCDMEKKD STIQNYNFRE YYEDNKLKFD YILRKGVSQT RNARYLMKMA GIDIE