Gene RPC_1389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_1389
Symbol	mutL
ID	3973310
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	1514339
End bp	1516138
Gene Length	1800 bp
Protein Length	599 aa
Translation table	11
GC content	69%
IMG OID	637924504
Product	DNA mismatch repair protein
Protein accession	YP_531270
Protein GI	90422900
COG category	[L] Replication, recombination and repair
COG ID	[COG0323] DNA mismatch repair enzyme (predicted ATPase)
TIGRFAM ID	[TIGR00585] DNA mismatch repair protein MutL

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.41073
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.777612
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGTTC GCCAATTGCC CGAGACCGTG GTCAACCGCA TCGCCGCCGG CGAGGTGGTG 
GAGCGGCCGG CCAGCGTGGT CAAGGAACTG GTGGAGAACG CGATCGACGC CGGCGCGAGC 
CGCATCGATA TTTTCACCGA CGGCGGCGGA AGGCGTCGGA TCGGCATCAC CGATGACGGT 
GCCGGCATGA CCCACGCCGA CCTGACATTG GCGGTCGATC GCCACGCCAC CTCGAAGCTC 
GACGACGAGG ATCTGCTGGC GATCCGCACG CTGGGATTTC GCGGCGAGGC GCTACCCTCG 
ATCGGCTCGG TGGCGAAGCT GTCGATCACC ACGCGGCACG CCGCCGAACC GCACGCCTGG 
GCGCTCGCCG TCGAGGGCGG CGCCAAGTCG CCGATCGTGC CGGCGGCGCT GAGCCACGGC 
ACCCGCGTCG AGGTCTCCGA CCTGTTCTAT GCGACGCCGG CGCGGCTGAA ATTTCTCAAG 
ACCGACCGCA CCGAGGCCGA AGCGATCCGC GAGGTGGTGC GACGGCTGGC GATGGCGCGG 
CCGGACATCG CCTTCAGCAT GGCCGGCGAG GAGCGCGCGC CGGTGACCTG GGCGGCGGCG 
TTGCCCGGCG CGGCGGGACG GTTGACCCGG CTCGGCGACA TTTTGGGCGG CGATTTTCGC 
AGCAACGCCA TCGAGGTGCG TTCGGAACGC GACGGCGTGG TGGTCGAGGG CTTCGCCGCC 
GCTCCGTCGC TGACCCGCGC CAACGCGCTC GGGCAATATC TGTTCGTCAA CGGCCGCCCG 
GTGCGCGACA AACTGATCAT CGGCGCGGTG CGAGCGGCTT ACTCCGACTA TCTGCCGCGC 
GACCGCCATC CGGTGGTGGC GCTGTTCGTC TCCCTCGACA GCCGCGAGGT CGACGCCAAT 
GTGCATCCGG CCAAGACCGA GGTGCGGTTT CGCGATGCCG GGTTGGTTCG CGCGCTGATC 
GTGCACGCGC TGAAAGAGGG ATTGGCGCGC GAGGGCAAAC GTACCGCCGC CAACGACGCC 
GGCGCCACGA TCTCCTCGTT CCGTCCATCG TTCGCGCCGC GCGCCAATTG GGACTGGCGC 
AGTTCGCCGT CCTATCCGGT GGCCGGGAGT GCGGCGTTCG ACGCTGCGGC CGGTTTCGCC 
GAGCGCGAGC AGTCGGGTTT CGACGTCGGC GCGCCGTCGG CCGATGTGCG CAGCTATCAG 
CCGTCCGCCG ATTTCACCGA TCGGCCGCTC GGCGCCGCGC GGACGCAGAT TCACCAGACC 
TATATCGTGG CGCAGACCCG CGATGGCCTC GTCGTGGTCG ATCAGCACGC CGCCCATGAG 
CGGCTGGTCT ATGAGAAGCT GAAGGCCTCG CTCGCCACCA ACGGCGTGCA GCGGCAGATC 
CTGCTGATCC CGGAAATCGT CGAGCTCGAC GAGGCCACGG TGGAGCGCCT GGTCGCGCGC 
GGCGAGGAAC TGGCGACGTT TGGCCTGGTG GTGGAATCCT TCGGCCCGGG TGCGGTGGCG 
GTGCGCGAGA CGCCGTCGCT GCTCGGCAAG ACCGATGCCG GCGCGCTGCT GCGCGATCTC 
GCCGAGCACA TGGCGGAATG GGACGAGGCG CTGCCGCTGG AACGGCGCTT GCTGCACGTC 
GCAGCCACCA TGGCCTGCCA CGGCTCGGTG CGCGCCGGCC GGGTGCTGAA GCCGGAGGAA 
ATGAACGCGC TGCTCCGCGA AATGGAAGAC ACCCCGAATT CCGGCCAGTG CAACCACGGC 
CGCCCGACCT ATGTCGAACT GAAATTGTCG GACATCGAGA AGCTGTTCGG GCGCAGGTAG

Protein sequence

MPVRQLPETV VNRIAAGEVV ERPASVVKEL VENAIDAGAS RIDIFTDGGG RRRIGITDDG 
AGMTHADLTL AVDRHATSKL DDEDLLAIRT LGFRGEALPS IGSVAKLSIT TRHAAEPHAW 
ALAVEGGAKS PIVPAALSHG TRVEVSDLFY ATPARLKFLK TDRTEAEAIR EVVRRLAMAR 
PDIAFSMAGE ERAPVTWAAA LPGAAGRLTR LGDILGGDFR SNAIEVRSER DGVVVEGFAA 
APSLTRANAL GQYLFVNGRP VRDKLIIGAV RAAYSDYLPR DRHPVVALFV SLDSREVDAN 
VHPAKTEVRF RDAGLVRALI VHALKEGLAR EGKRTAANDA GATISSFRPS FAPRANWDWR 
SSPSYPVAGS AAFDAAAGFA EREQSGFDVG APSADVRSYQ PSADFTDRPL GAARTQIHQT 
YIVAQTRDGL VVVDQHAAHE RLVYEKLKAS LATNGVQRQI LLIPEIVELD EATVERLVAR 
GEELATFGLV VESFGPGAVA VRETPSLLGK TDAGALLRDL AEHMAEWDEA LPLERRLLHV 
AATMACHGSV RAGRVLKPEE MNALLREMED TPNSGQCNHG RPTYVELKLS DIEKLFGRR