Gene Oter_4044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Oter_4044
Symbol
ID	6204835
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Opitutus terrae PB90-1
Kingdom	Bacteria
Replicon accession	NC_010571
Strand	-
Start bp	5244531
End bp	5246417
Gene Length	1887 bp
Protein Length	628 aa
Translation table	11
GC content	68%
IMG OID	641693712
Product	DNA mismatch repair protein MutL
Protein accession	YP_001820918
Protein GI	182415852
COG category	[L] Replication, recombination and repair
COG ID	[COG0323] DNA mismatch repair enzyme (predicted ATPase)
TIGRFAM ID	[TIGR00585] DNA mismatch repair protein MutL

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0816003
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.310643
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAAAG TCCGGATCCT GTCCGATCGC GTCGCGAACC AGATCGCCGC GGGCGAAGTC 
ATCGAACGTC CCGCCGCGGT CGTGAAGGAA CTCGTGGAAA ACGCGCTCGA CGCCGGCGCG 
ACGCGGATCG AGGTGGAATT CCGGCACGGC GGCCGGTCGT TGATGCGCGT CGAGGACAAC 
GGCTCCGGCA TGTCGCGCGA CGACGCGCTG CTCGCGCTCG AACGGCATGC GACCAGCAAG 
ATCAGCGAGG CCGCCGATCT CGACCGGCTG GGGAGCTACG GCTTCCGCGG CGAGGCGCTG 
CCGTCGATCG CGAGCGTGTC GCGATTCGAG CTGCAGACGC GCGAGGCCGG CCAGAACGTG 
GGCACCGAGG TGCTGGTGAG CGGCGGCAAG CTGGTGCACG TGCGCGACTG TGGTCGGCCC 
GTCGGCACGC GGATCGAGGT GGCACAGCTG TTCAACTCGG TGCCCGCGCG GCGGAAATTT 
CTCAAGAGCG ACCAGACCGA GGCGGCCCAT ATCGTGCAAT GCGTGCGGCT GTATGCCCTG 
GCCTGTCCGG GAACGGCTTT CTCTCTCATC GAGGACGGAC GCGTGATTTT CCGCTCGCCG 
GAATGCCCTA CACTCGCAGA GCGGATTGCG GAAATTTTCG GTCGGCAGAC CGCCGAGTCG 
CTCGTGCCGA TCGAATCGGT GGAATCCGGC ATGCGGCTCG GCGGGCTGAT CGGCCGGCCA 
GGTGTGGGCC GCGGCACGCG GCATGAGATG ATCGTGTTCG TGAACCAGCG GCCAGTCGAC 
AGCCGGACGC TGAACTATGC GCTGATCGAG AGCTATTACG AGTCCGTGCC GAAGGGGCGC 
TATCCGCTGG CGTTCGTGTT TTTCGAGTGT GATCCCGCGG CGGTCGACGT GAACGTGCAT 
CCGGCAAAGC GCGAGGTGCG GTTCCGCAAC GAGCCCGCGG TCCGCAGCTT TGTGATCCGG 
TCGGTGCTGC AGCGGCTGAG GGAGATTGCC GACCATCGAT CCGACTTCGC CCAGCCTTCG 
GCGGACAACA TGCCCAAGCC CGAGTCGCCA GGCGCGCCGG CGGCGCACGG GCGGAAGGAC 
GACGCGCCTG CAGCGCATGC CGAGGGTAGG GCGGCGACTC CGCTCGCCGC CGGGAACCTG 
ATTGTAACGG CGCGCTTCGG CGCGGAGTCC ACGCCGTACC TCGAGAAATC CGGGGCGATC 
GCGGGTGCGC GGCCGGCGGG GGTGTTGCCG CCCGCGGTGC CGCGAATACC GGCCGCGCCA 
ATGCCGGTGA ATGCCGGAGC CGCCGCCGTA CCGGCGCCGC TCAAGCCCGC TTCGCCCTCG 
TGGCGGTTTG TCGGACTGGC GCACGGCAAC TACGCGCTGT TCGAGACGAC CGCGGGTCTG 
ATCCTGCTGG ATCGCCGGGC GGCGCACGAG CGCGTCTGGT TCGAGCGGCT GCAGGAACAG 
TTTCGCTCCG GCGCGGTGCC GAGCCAGCGG CTGCTGCTGC CGGTGCCGGT GGAACTCGAT 
CCGATCGCCG CGGCGTTGCT GCTGGACCGA GTGCAGTTTC TCAACGCGCA CGGGTTCGAG 
ATCGCGGAGT TTGGCCGAAA TTTTTTCCGC ATCGAGGCGG TGCCGGCGTG GATGGAGCCC 
GCGGATGCCG AGCCGTTCCT GCGCGATCTG CTCGGGGCAT TCCGCGAGGG CCACTGGCCC 
GATCGCGACG CCAACCTCGC GCGGGAGGAA CTGGCCCGAC TCGCCTCGGT CAAAGCGGTC 
CGCCTGCCCG CCGTCACGGG CGAGCAGGAG CTCCGGGCCT TGGTCACGCA CTTGTTCGCC 
ACGCGTACGC CCATGACCAA TCCAGCCGGC CGACCGACCT ACATTGAGCT GAATCACGCG 
GAGCTGGCGC GGCGGTTCCA AAAATGA

Protein sequence

MAKVRILSDR VANQIAAGEV IERPAAVVKE LVENALDAGA TRIEVEFRHG GRSLMRVEDN 
GSGMSRDDAL LALERHATSK ISEAADLDRL GSYGFRGEAL PSIASVSRFE LQTREAGQNV 
GTEVLVSGGK LVHVRDCGRP VGTRIEVAQL FNSVPARRKF LKSDQTEAAH IVQCVRLYAL 
ACPGTAFSLI EDGRVIFRSP ECPTLAERIA EIFGRQTAES LVPIESVESG MRLGGLIGRP 
GVGRGTRHEM IVFVNQRPVD SRTLNYALIE SYYESVPKGR YPLAFVFFEC DPAAVDVNVH 
PAKREVRFRN EPAVRSFVIR SVLQRLREIA DHRSDFAQPS ADNMPKPESP GAPAAHGRKD 
DAPAAHAEGR AATPLAAGNL IVTARFGAES TPYLEKSGAI AGARPAGVLP PAVPRIPAAP 
MPVNAGAAAV PAPLKPASPS WRFVGLAHGN YALFETTAGL ILLDRRAAHE RVWFERLQEQ 
FRSGAVPSQR LLLPVPVELD PIAAALLLDR VQFLNAHGFE IAEFGRNFFR IEAVPAWMEP 
ADAEPFLRDL LGAFREGHWP DRDANLAREE LARLASVKAV RLPAVTGEQE LRALVTHLFA 
TRTPMTNPAG RPTYIELNHA ELARRFQK