Gene Sfum_1919 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sfum_1919
Symbol
ID	4459756
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Syntrophobacter fumaroxidans MPOB
Kingdom	Bacteria
Replicon accession	NC_008554
Strand	+
Start bp	2338674
End bp	2340686
Gene Length	2013 bp
Protein Length	670 aa
Translation table	11
GC content	69%
IMG OID	639702686
Product	DNA mismatch repair protein MutL
Protein accession	YP_846039
Protein GI	116749352
COG category	[L] Replication, recombination and repair
COG ID	[COG0323] DNA mismatch repair enzyme (predicted ATPase)
TIGRFAM ID	[TIGR00585] DNA mismatch repair protein MutL

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.770906
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00107591
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCCAGAA TCACGATTTT GCCCGATATC CTGTGCAACC AGATCGCCGC CGGAGAAGTG 
GTGGAGCGGC CGGCCGCCGT CGCCAAGGAG CTCCTCGAGA ACAGCATCGA CGCCGGCGCC 
CGAAGGATCT CCCTGTCCAT CGCCGACGGA GGCCGAAAAG AGATCCGGGT GGTGGACAAC 
GGCTCGGGCA TGCACCCCGA CGATGCGCTC CTGGCCCTGG AACGCCACGC CACCAGCAAG 
ATCCGGTCCA TCGAGGACCT GCAGGCGATC GGTTCCCTGG GGTTTCGCGG CGAAGCCCTT 
CCCAGTATCG CCGCGGTGAG CCGCTTCGAA CTGGTGACGC GCGAACCCGA TGCCGTCGCG 
GGGACGTTCA TCCGGGTCGA AGGCGGCGTG GTGCGCGAGG TCCGCGAAAC CGGGTCCCCC 
GCGGGAACCA GGATCACCGT TCGCGACCTT TTCTACAACG TGCCCGCTCG ACGCAAATTC 
CTGCGCGCCG CGGACACCGA AACCGCATAC ATCTGCGACC AGTTCCAGCG GCTGGCCATG 
GCTCACCACG CCGTCCATTT TCAGCTCATC AACCGGGAAC GCACCCAATA CGACTTCCCC 
GGCGCGGCCT CGCCCGAAGA GCGGGCCGGG CAGGTTCTCG GCGCCGAGAC CCTCAAGCGC 
GCCATCCCCT TTTGCGTGGA AAACGCGTCC GCCAGGCTCC GAGGCATGGT CGGCACACCC 
GACCTGCAGC GGGCCAACAG CCATTCCCTC TTCGTTTTCG TGAACGGCCG GCCGGTCTGG 
GACCGCGCCG TCAACCGGGC GATCCTCGCG GCCTTCGAGA GCCTCATCCC GCGGGGCAAG 
TTCCCCGTCG CGGTGCTCTT CCTCGAGCTC GATCCCCTCC ATGTGGACGT CAACGTTCAC 
CCCACCAAGC GCGAAGTCCG GTTCAAGCAC CCCGGAGGCG TCATCGACAC CGTGCGCGGG 
GCCATCCGCG ACGCTCTGTG CCACCTCAGG CCGCTCCACG GCTCCGCCGC TGCCGCACCC 
CGTCCCTTCT CCGAAACGGC GGACCAGCGG GCTTTCCGCG ATTCCCTGGT GAGGGAAGGC 
CAATTGTCCT TCGACCGCGG CCGTCCCCTC TCGCGCCCGC CAGGCTTCCC GTCCGAGCGT 
TGGCGCGAAA GGCACCGGCC CGACGCCGAA CCGCCGTACC CGCTCTTGCG CGAGCCGGCG 
CCGACGGAGA ATCCCCGCCG CGAGGCCGGA TCTCCGCCCG CAGCCCCCGC CGATTCACTC 
TTCGACGAAG GCGCGGCGCC GCAGCCCGAC AATCCCGACA CCGACTTTTT TGCCGAACCG 
AAGCGGGCGG CCGGCGGGCC GGCCTCGACC CATGCGCCCG TCACGGTCGA TACGGCGGCC 
TTCGCGGACG CCTTCCAGGC CTTCGAAGCC GCGACACACC TCCATGCCGG CGATGTCCCG 
GCTCTTGCCG AGCTTCCCGT CATCGGCCAG CTCGCCAACA CCTACATCCT GCTCGAAGCC 
CCCGACGGGC TGATCCTCAT CGACCAGCAC GCGGCTCACG AGCGCATCAT CTTCGACGCC 
CTCTCCTTTC CGGCCGGCGG TCCGGCCCGG CAGAGGCTGA TACGCCCGGC CGTCATCGAT 
CTCCCCCCGC GCGATGCGGC CATGCTCCGC CGCTGGCTGC CGCTGCTCGA GGAAATCGGC 
GTCGAAATCG AATCCTTCGG CGGCGACTCC TTCGTCGTGC ACGCCGTCCC GGCACCCCTT 
GGCGAATGCC CGCCCGAGGG GCTGGTCCGC GAGTTGCTCG CCTCGGCCAT CGAAGGCGAT 
GACGCCCCGC GCTGGAACGT CCTCGGCCGC CTGGCCAAGA CCGCCGCCTG CCACCGCGCC 
GTGAGGGCGG GCCAGCGGCT GAGACCCGAG GAAATCCGGC TCCTCCTGGA AGGGCTCGAC 
CGTACCCGGT TCGCTTCCAC CTGCCCGCAC GGCCGCCCGG TCTGGTACAA GATGACCCTC 
TCCGACGTCG CCAGGCTCTT CCAGCGCACA TGA

Protein sequence

MARITILPDI LCNQIAAGEV VERPAAVAKE LLENSIDAGA RRISLSIADG GRKEIRVVDN 
GSGMHPDDAL LALERHATSK IRSIEDLQAI GSLGFRGEAL PSIAAVSRFE LVTREPDAVA 
GTFIRVEGGV VREVRETGSP AGTRITVRDL FYNVPARRKF LRAADTETAY ICDQFQRLAM 
AHHAVHFQLI NRERTQYDFP GAASPEERAG QVLGAETLKR AIPFCVENAS ARLRGMVGTP 
DLQRANSHSL FVFVNGRPVW DRAVNRAILA AFESLIPRGK FPVAVLFLEL DPLHVDVNVH 
PTKREVRFKH PGGVIDTVRG AIRDALCHLR PLHGSAAAAP RPFSETADQR AFRDSLVREG 
QLSFDRGRPL SRPPGFPSER WRERHRPDAE PPYPLLREPA PTENPRREAG SPPAAPADSL 
FDEGAAPQPD NPDTDFFAEP KRAAGGPAST HAPVTVDTAA FADAFQAFEA ATHLHAGDVP 
ALAELPVIGQ LANTYILLEA PDGLILIDQH AAHERIIFDA LSFPAGGPAR QRLIRPAVID 
LPPRDAAMLR RWLPLLEEIG VEIESFGGDS FVVHAVPAPL GECPPEGLVR ELLASAIEGD 
DAPRWNVLGR LAKTAACHRA VRAGQRLRPE EIRLLLEGLD RTRFASTCPH GRPVWYKMTL 
SDVARLFQRT