Gene Ccel_1696 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1696
Symbol
ID	7312269
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	2040083
End bp	2042080
Gene Length	1998 bp
Protein Length	665 aa
Translation table	11
GC content	37%
IMG OID	643608624
Product	DNA mismatch repair protein MutL
Protein accession	YP_002506027
Protein GI	220929118
COG category	[L] Replication, recombination and repair
COG ID	[COG0323] DNA mismatch repair enzyme (predicted ATPase)
TIGRFAM ID	[TIGR00585] DNA mismatch repair protein MutL

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.930861
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGACGCA TAATTGTACT GGATGAAAAT ACTTCAAATA AAATAGCTGC TGGAGAGGTT 
GTTGAAAAGC CAGCTTCTGT TGTAAAGGAA TTGGTGGAAA ACTCTATTGA TGCAGGTGCA 
ACCAGCATCT CAGTTGATAT AAAGAATGGC GGTATATCTT ATATTAAAAT AGCCGACAAC 
GGAATCGGCA TGGATGAGGA CGATGTGGAA ATTGCCTTTG AACGTCATGC CACCAGTAAA 
ATTAAAAGGG CGGAGGATCT TGATTCCGTT ATAACAATGG GGTTCAGGGG GGAGGCTCTG 
GCAAGTATAG CCTCGGTTGC ATCTGTTGAG CTTATGACAA AGACAGCTGC AAGTGCCTAC 
GGAATGTATG TACATGTAAG AGGAGGAGTT TTACAAGACG TAAGGCAGAC AGGATGTCCT 
GTCGGCACAA CGTTTATTAT TAAGGATTTA TTTTTCAATA CTCCTGCTCG TTACAAGTTT 
TTGAAAAAGG ATTCTACCGA AGCAGGATAT ATTTCTGATA CAATATCGAG AATAGCTTTG 
GGTAATCCGA ATATTTCTTT TAAACTGACA AACGGAAAAA CACCATTAAT TCATACCCCG 
GGAAATAATG ACTTGAAAAG TGTTATTTAC AGTATTTACG GAAAAGAAAT TATAAAAAAC 
CTTGTTCATA TAGAGTACGC TGACGACAAG GTAAAGATAA GCGGATATAT AGGGAAACCG 
GAAGCTGCCA GATCAAACAG GAACTATCAA TCTCTCTATA TAAATAAAAG ATATGTGAAA 
AGCAAACTGG TATCATATTC AGTTGAACAA GCCTTTTCAA GCATACTTAT GAAAAACAGG 
TTTCCTTTTT TTGTATTAAA TATTGACATT AATCCTATAT TGGTAGATGC CAATGTACAC 
CCTGCAAAAA TCGAGGTACG GTTTGCTGAC GAAAGCTATT TATCCAGAAC TATATATATG 
GCTGTTTCCA ATGCTCTTAC TACAGGGGGA GGCCTGTTTA ATCCTGTATC AGTTCCTGAT 
AAAGACAGAG AGCTGTTCAA GTTTGCAGAT AATTCCCAAC CTAAAAAGGA ATATGTCCAG 
AATGAAATAC AATTAAATAA TAAGCAGGAG GAAAACAAAA AAGCCGATGA GATACGTTTG 
TTTACAAAAG CTCTGGAGCC ATTGGCAAAG GTCGATGTAC ACAAAGTAAG TACAGCAGCG 
GAAAAACAAC CGGCGGATAC TTCCTCCTTT ACTTTTACAA GGTCTGAAGA CTATAATGTC 
GGACAACCAA AGAATCTAAT CACGAATGTT AAGCAGGAAA ATTCTGATGA GCTTAAAAAT 
AATTCTCCCG GAATCAGGGA GGATGATTCC TCTCAGAACT TTGATGAAAC AATAAATAAA 
CAAGATCAGG AAGTAAATAA AGAAAGGGTT TATACTGAAC TAGCTGACAT GAAATACATA 
GGGCAGGCTT TTTCCACTTA TATTCTTTTA CAAAATAATG ATGAGCTTGT AATGGTAGAT 
CAGCACGCAG CACACGAAAG AATAATATAT GAAAAACTCA GAGCAAAATT TGATTCACAG 
GAAAACACAA CTCAGCTGTT ATTGGAGCCG GTAGTTATTC AACTCCAGCC TTTTGAAATT 
GATACAATAA AAGCAAAGGA AAAGTTGCTG ACTGGTATTG GATTTGTTTA TGAGGATTTT 
GGAAATAATA CCATTATTAT CAGAGGAATT CCATATATGG TAGGAGACTA CTCGCCCAGA 
GATATTTTTA TTGAATTGAC ACAAAAACTT CAAGAATCAA TAAAACCTGT CAGCACACCT 
TTAGCTGATG AAATAATTCA TACCATTGCA TGTAAGGCTG CTATAAAAGC AAATAAAAAA 
CTTGATGAAA AAGAGGTTCA TCAGCTTTTG ACTGAGCTTT CCAATACCGG AAGACGATAT 
ACCTGTCCTC ATGGACGTCC TACTGTTATA CGTCTGACAA AAAACGAGAT AGAAAAAATG 
TTTAAAAGAA TTGTCTAG

Protein sequence

MGRIIVLDEN TSNKIAAGEV VEKPASVVKE LVENSIDAGA TSISVDIKNG GISYIKIADN 
GIGMDEDDVE IAFERHATSK IKRAEDLDSV ITMGFRGEAL ASIASVASVE LMTKTAASAY 
GMYVHVRGGV LQDVRQTGCP VGTTFIIKDL FFNTPARYKF LKKDSTEAGY ISDTISRIAL 
GNPNISFKLT NGKTPLIHTP GNNDLKSVIY SIYGKEIIKN LVHIEYADDK VKISGYIGKP 
EAARSNRNYQ SLYINKRYVK SKLVSYSVEQ AFSSILMKNR FPFFVLNIDI NPILVDANVH 
PAKIEVRFAD ESYLSRTIYM AVSNALTTGG GLFNPVSVPD KDRELFKFAD NSQPKKEYVQ 
NEIQLNNKQE ENKKADEIRL FTKALEPLAK VDVHKVSTAA EKQPADTSSF TFTRSEDYNV 
GQPKNLITNV KQENSDELKN NSPGIREDDS SQNFDETINK QDQEVNKERV YTELADMKYI 
GQAFSTYILL QNNDELVMVD QHAAHERIIY EKLRAKFDSQ ENTTQLLLEP VVIQLQPFEI 
DTIKAKEKLL TGIGFVYEDF GNNTIIIRGI PYMVGDYSPR DIFIELTQKL QESIKPVSTP 
LADEIIHTIA CKAAIKANKK LDEKEVHQLL TELSNTGRRY TCPHGRPTVI RLTKNEIEKM 
FKRIV