Gene Mlab_1168 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlab_1168
Symbol	mutL
ID	4795836
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanocorpusculum labreanum Z
Kingdom	Archaea
Replicon accession	NC_008942
Strand	-
Start bp	1188725
End bp	1190491
Gene Length	1767 bp
Protein Length	588 aa
Translation table	11
GC content	61%
IMG OID	640099841
Product	DNA mismatch repair protein
Protein accession	YP_001030604
Protein GI	124485988
COG category	[L] Replication, recombination and repair
COG ID	[COG0323] DNA mismatch repair enzyme (predicted ATPase)
TIGRFAM ID	[TIGR00585] DNA mismatch repair protein MutL

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.985109
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.444607
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCGGG TCAAAATCCT CGACGAGGAG ACGATCAGCC ACATCGCGGC GGGCGAAGTG 
GTCGAGCGTG CGGCGTCCGT CGTGAAAGAG CTCGTCGAAA ACGCCGTGGA TGCGGACGCC 
CAAATCATCC GGATCGGCAT ATCGGCCGAC AAAACCGGGA TAACCAAAAT CTCCGTCACG 
GACGACGGGA TCGGGATGGA CTTCGACGAC GCTCTTCTGG CATTCCGCCA GCACGCAACA 
AGCAAGATAT CCCGCCCTGA GGATCTCGAT GGGATCACCA CGCTCGGGTT CCGCGGCGAG 
GCTCTTGCAA GCATCGCGGC GATCTCGAAG GTGACCTTCA CGACAAAGGA ACGCGGCTCC 
CCTTCGCCCG AAGCGGCCCG CGTGGTGATC CACGGCGGCG AGCTGATCTC TCACTCGGCT 
GTTGGTGCGC CGGAAGGAAC GAGCGTTCTT ATCGACGCTC TCTTTTACAA CACTCCCGCC 
CGGCGCAAGT TCCAGAAGTC CGTTCCAACG GAGTTGTCCC ACGTCTACGA CATGGTCGAG 
CGGATCGCCC TTTCGAACAG GAACATCTCG TTTGTTCTGC TGTACAACGG CAAAGAGCGG 
TTCCAGACCT TTGGGACAGG CTCGTATCCG GACGTGATCG CCGCGGTGTT CGGCTCCACC 
TTTTCCAAAG AGCTGACCCC GGTCTCCGGC AGTTTCGGGC CGGTGAAAAT CGACGGCTGG 
ATCACGCGTC CCGGCTCGGA GATGAAGACG ACCCAGACGC GGTTTTATCT CTCGATAAAC 
GGCCGGCAGG TGACGTCCCG CCAGCTGCAG TGGGCGATCC GCGAAGGATA CGGCACGCTT 
CTGCCAAAGG GCATGTACCC TGCGGCGTTT CTTGATATCG TCCTCGATCC CCGGGACGTG 
GATGTGAACG TGCATCCGAC AAAGCGGGAG GTCCGCCTCT CCCGCGAGAG GGAAGTGATG 
CGGTGCGTTC AGGATGCGGT CTATACATCG CTGCATGAAG AGCGGGTCTT TTCCACCGCC 
CCCATGCCTA CCCTCGCCCG CGAGACTATC ACGACCCTTC CGGTAGAGAT CGTCGGCGAG 
CCGGTGCCTG TATATGCCGG GAAGCAGGAG ATGCATGAGG CAAGACAGGC CCCTCTCAAA 
CAGACGGAGA AGCAGCTTCG GCGGACCGAG TCTGCGGATC TGCCGGAGAC CGATCTGTTC 
GTCCCGGAAG TCCTCGGGCA GATCGGGGAC ACCTACATTC TTGCGAAGAA TGAATCCGGC 
GACCTTATCG TCGTGGATCA GCATGCGGCC CACGAGCGGA TCATGTACGA TCAGCTGCTC 
GCCCGCTCCT CGTCAGCGGA GGCCGGGCAG GAACTGATCG TCCCCCAGCC GATCACTCTC 
TCGAAAAAGG AGACCGCCGC CCTTCCCGAT TTGCTGGATG TCCTCGCCGC CGCGGGATAC 
CTTCTAGAAC CGTTTGGAAA AGACGTCTGG ATGGTCCGCT CCGTCCCCGT CGTCTCCTCA 
ACGCTCGGCG ACCCGGACAC CATCCATGCG ATCCTGGACG CGGCGCTGGA CGGGGTGGGG 
AACACCGACG AGGTCCTTGA TCGGGTGCTG AAGACCGCTG CGTGCCGTGC TGTTGTGAAG 
GGGAACACGC CGCTGACGAT CGAACAGATG CAGCGTCTCT TACGCCAGCT TATGGCGACA 
AAATCCCCGT ACACCTGCCC TCACGGTCGC CCTACGACGA TCGTTCTCTC GAAATCGCGG 
TTGGCCGGGA TGTTTCTGAG AACATAA

Protein sequence

MSRVKILDEE TISHIAAGEV VERAASVVKE LVENAVDADA QIIRIGISAD KTGITKISVT 
DDGIGMDFDD ALLAFRQHAT SKISRPEDLD GITTLGFRGE ALASIAAISK VTFTTKERGS 
PSPEAARVVI HGGELISHSA VGAPEGTSVL IDALFYNTPA RRKFQKSVPT ELSHVYDMVE 
RIALSNRNIS FVLLYNGKER FQTFGTGSYP DVIAAVFGST FSKELTPVSG SFGPVKIDGW 
ITRPGSEMKT TQTRFYLSIN GRQVTSRQLQ WAIREGYGTL LPKGMYPAAF LDIVLDPRDV 
DVNVHPTKRE VRLSREREVM RCVQDAVYTS LHEERVFSTA PMPTLARETI TTLPVEIVGE 
PVPVYAGKQE MHEARQAPLK QTEKQLRRTE SADLPETDLF VPEVLGQIGD TYILAKNESG 
DLIVVDQHAA HERIMYDQLL ARSSSAEAGQ ELIVPQPITL SKKETAALPD LLDVLAAAGY 
LLEPFGKDVW MVRSVPVVSS TLGDPDTIHA ILDAALDGVG NTDEVLDRVL KTAACRAVVK 
GNTPLTIEQM QRLLRQLMAT KSPYTCPHGR PTTIVLSKSR LAGMFLRT