Gene Mboo_1217 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mboo_1217
Symbol	mutL
ID	5410389
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Methanoregula boonei 6A8
Kingdom	Archaea
Replicon accession	NC_009712
Strand	+
Start bp	1238640
End bp	1240478
Gene Length	1839 bp
Protein Length	612 aa
Translation table	11
GC content	59%
IMG OID	640868444
Product	DNA mismatch repair protein
Protein accession	YP_001404378
Protein GI	154150760
COG category	[L] Replication, recombination and repair
COG ID	[COG0323] DNA mismatch repair enzyme (predicted ATPase)
TIGRFAM ID	[TIGR00585] DNA mismatch repair protein MutL

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.469734
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.0661873
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGCAG AGGAGCATCC CCCCGCGATA CGGGTACTGG ACCCGGCTAC TGTCAACCAG 
ATCGCGGCGG GAGAAGTGAT CGAACGGCCG GCTTCGGTAG TAAAGGAAAT GGTGGAGAAT 
GCGATCGATG CCGGCGCCCG CACGATCCGG ATTGATATTA CTTCCGTGCA GGGTGGGATC 
ACAGCGATAA AGGTAACCGA CGACGGGTGC GGGATGTCGC CGGTTGATGC AGAGCTTGCC 
TTTGTCCCGC ATGCCACAAG CAAGATCCAT ACGCTTGACG ATCTCTTCTC CATCCATTCC 
CTGGGATTCC GGGGTGAGGC ACTGGCAAGC ATTGCGGCGA TCGCAAAAGT TACACTTATT 
ACAAAGCCAC AAGGCAGCGA CCGGGTGCCC GGTACCCGGA TTGTGGTGGT GGGCGGAGAG 
ATCCAATTAC GTGGCGGGAC CGGTGCCCCC GAAGGCACAA GCGTGCTTGT GGAAGAATTG 
TTCTTTAATA CCCCTGCCCG GAAAAAGTTC CAGAAGAGCC TTACAACAGA AATTGCCCGC 
ATCCACGGCA TCCTCGAAGG CCTCTGCCTT GCCTGCCCGC AGATCTCGTT TAAGGTCTTC 
CATAACAACC GCGAGCAGCT GGCCACCGAG CGGACCGGCC GGCCGCTCGA CACAATCGCC 
CGGATCTTCG GAAACGAATC TGCCCGCGAA CTTATCCCGG CCGCCGCTGC CCTCCCGTTC 
ATGCGTATAT CCGGCTACAT TTCCCGTCCG GCTCTCTCCC GCAAGGATCA TGACCGGATC 
CTCATTGCGA TCAATGGCAG GTACATCTCA TCCCCACCCG TAACAACTGC CATCCGCGAA 
GGCTATGGGA CTCTCCTTCC TCATGGCCGG TATCCTGTTG CGTTTCTCTC ACTTGAGATC 
GACACCCGGC TTGTGGACAT CAACGTCCAT CCTACCAAAA AGGAGGTCCG GCTCACCAAA 
GAAAAAGAGA TCACTGATGG TGTACGTGAA GCAGTGCGGG CAGCGCTTGC ATCGGGCGAT 
CTGATCCCTG AGGTGAACGC ACCGAAACCG GTTTACCGGA AACTGGATGC CGGGGGATCT 
GACTTATCTC CTGTGCCGTA TGTTGCAGAA CCTGCAGAAC CGTACTGTGC CGGAACCCTC 
CCTTCAGCAG TATCCACAGG AACGCTCTCG CCATTCACGG AACCGACCCA TACCGGGACG 
GTTGCAACCG ATTATCGCCT CCGCCAGACC GAGCTTGCAA GCGGTGTCCC GCCGGTTACG 
GCCGTAGTGC CGGAGATGGA TGTAATCGGG CAGATTGGCG GGATCTATAT CCTTGCCGAA 
GCGGCTGGCG GGGAACTTAT CATTATCGAC CAGCACGCTG CCCACGAGCG AATCTTCTAT 
GAGCAGGTGA CAAGGAGCAT GGCAGCCCGG CAGGCTCAGG AGCTGCTTGT CCCGGCAATC 
ATCCACTGCC CTCCCAAAGA TACTGCGATT CTCAAAAGCC TGATCCCCGC GCTTGCTCAG 
GAAGGTGTTA TTATCGAGGA GTTCGGGGCC GGATCCTTTC TGGTCCGGGC AGTTCCTGCC 
CTGATGGGAA AGGTGGAGGG GCCGGCAATG ATTGACGACC TGGTAAGCGA TCTCCTCCAC 
AAGGACCTTG ACCGCCCGGT CAGCGACCGG GAGCGCCTGA CCCGGATCAT TGCCTGCCGG 
AGCGCGATAA AAGCCGGTAC GGTCTGCACC GTCGAACAGT GCCGGCGGCT TATTTCCCAG 
CTCAGGGCAA CAACGACACC GTTTACCTGC CCGCACGGCC GGCCCACCAT GGTCAGGTTC 
ACCCGCGCAA AACTGGACGA GATGTTCAAG CGGACATAA

Protein sequence

MGAEEHPPAI RVLDPATVNQ IAAGEVIERP ASVVKEMVEN AIDAGARTIR IDITSVQGGI 
TAIKVTDDGC GMSPVDAELA FVPHATSKIH TLDDLFSIHS LGFRGEALAS IAAIAKVTLI 
TKPQGSDRVP GTRIVVVGGE IQLRGGTGAP EGTSVLVEEL FFNTPARKKF QKSLTTEIAR 
IHGILEGLCL ACPQISFKVF HNNREQLATE RTGRPLDTIA RIFGNESARE LIPAAAALPF 
MRISGYISRP ALSRKDHDRI LIAINGRYIS SPPVTTAIRE GYGTLLPHGR YPVAFLSLEI 
DTRLVDINVH PTKKEVRLTK EKEITDGVRE AVRAALASGD LIPEVNAPKP VYRKLDAGGS 
DLSPVPYVAE PAEPYCAGTL PSAVSTGTLS PFTEPTHTGT VATDYRLRQT ELASGVPPVT 
AVVPEMDVIG QIGGIYILAE AAGGELIIID QHAAHERIFY EQVTRSMAAR QAQELLVPAI 
IHCPPKDTAI LKSLIPALAQ EGVIIEEFGA GSFLVRAVPA LMGKVEGPAM IDDLVSDLLH 
KDLDRPVSDR ERLTRIIACR SAIKAGTVCT VEQCRRLISQ LRATTTPFTC PHGRPTMVRF 
TRAKLDEMFK RT