Gene Rpal_4855 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4855
Symbol	mutL
ID	6412541
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	5217185
End bp	5218972
Gene Length	1788 bp
Protein Length	595 aa
Translation table	11
GC content	70%
IMG OID	642714732
Product	DNA mismatch repair protein
Protein accession	YP_001993819
Protein GI	192293214
COG category	[L] Replication, recombination and repair
COG ID	[COG0323] DNA mismatch repair enzyme (predicted ATPase)
TIGRFAM ID	[TIGR00585] DNA mismatch repair protein MutL

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCGTTC GCCAACTTCC CGAAATCATC GTCAACCGCA TCGCCGCCGG CGAGGTGGTG 
GAGCGGCCGG CGAGCGTGGT GAAGGAGCTG GTCGAGAACG CGATCGACGC AGGTAGCAGC 
CGGATCGACA TCTTCTCGGA CGGCGGAGGC CGGCGAAAGA TCGTGATCGC CGACGACGGC 
TCCGGCATGA CCGCGGCCGA TCTCGCGCTC GCGGTCGATC GCCACGCCAC CTCGAAGCTC 
GACGACGAGG ATCTGCTGCA GATCCGCACC CTCGGCTTTC GCGGCGAGGC GCTGCCGTCG 
ATCGGCGCGG TGGCGAAGCT GTCGATCACC ACGCGCCATG CCAGCGAGCC GCACGCCTGG 
ACGCTCCGCG TCGAGGGCGG CGACAAGACT CCGATCGCTC CGGCGGCGCT GAGCCAGGGC 
ACCCGCGTCG AAGTCGCCGA CCTGTTCTTT GCCACGCCGG CGCGGCTGAA GTTCCTCAAG 
ACCGACCGCA CCGAGGCCGA GGCGATCCGC GAGGTGGTGC GGCGCCTGGC GATGGCGCGG 
CCGGACATCG CCTTCACGCT GGCCGGCGAG GAGCGCGCGC CGGTGACCTG GGCGGCGGCG 
TTGCCCGGCG CGCCGGGGCA ATTGATCCGG CTCGGCGACA TCCTCGGTGC AGACTTCCGC 
GCCAATGCGA TCGAAGTCCG TGCCGAGCGC GAGGGCGTGG TGGTCGAAGG CTTCGCGGCG 
TCGCCGGCGC TGACCAAGGC CAATGCGCTC GGCCAGTATC TGTTCGTGAA CGGCCGCCCG 
GTGCGCGACA AGCTGATCCT GGGGGCGGTG CGCGCCGCCT ATTCGGATTA CTTGCCGCGC 
GACCGCCATC CGGTGGTGGC GCTGTTCGTC ACGCTGGATA GCCGCGAGGT CGACGCCAAC 
GTGCATCCGG CCAAGACCGA GGTGCGGTTC CGCAATGCGG GGCTTGTCCG TGCGCTGATC 
GTGCACGCGC TCAAGGACGG CTTGGCGCGC GAGGGCCGTC GCACCGCCGC CAACAGCGCC 
GGCAGCGTGA TCTCGACATT CCGGCCCGCC TCGATGCCGC CGGCGAATTG GGACTGGCGA 
GCTTCGCCGT CCTATCCGGT CGGCGGCAGC GCGGCGCCGT CGTTCGCCGA GCGCGCGCAG 
GCCGCGTTCG ATGTCGGCGC GCCGAGCGCG GATATTCGTC CGACCGAGGT CACGCCGGAT 
CTGCTCGACC GTCCGCTCGG CGCGGCGCGC ACCCAGATCC ACGAGACCTA CATCGTGTCG 
CAGACCCGCG ATGGACTCAT CGTTGTGGAT CAGCACGCCG CGCATGAGCG CATTGTCTAT 
GAGCGGCTGA AGGCCTCGCT CGAAGCCAAC GGCGTGCAGC GCCAGATCCT GCTGATCCCC 
GACATCGTCG AGATGGACGA GGCGACGGTG GAGCGTCTGG TCGCGCGCGG CGAGGAGCTG 
GCGAAGTTCG GCCTGGTGAT CGAGAGCTTC GGCCCGGGCG CGGTGGCGGT GCGTGAGACG 
CCGTCGCTGC TCGGCAAGAC CGATGCCGGC GGTCTGCTCC GCGACCTCGC CGAACACATG 
GCCGAATGGG ACGAAGCGCT GCCGCTGGAG CGCCGCCTGA TGCACGTCGC CGCCACCATG 
GCCTGCCACG GTTCGGTGCG GGCCGGGCGC GTCCTCAAGC CCGAGGAAAT GAACGCGCTG 
CTGCGCGAGA TGGAAGCGAC GCCGAACTCC GGCCAATGCA ACCACGGCCG CCCGACCTAT 
GTCGAACTGA CGCTGACCGA TATCGAGAAG CTGTTCGGGC GGAGGTAG

Protein sequence

MPVRQLPEII VNRIAAGEVV ERPASVVKEL VENAIDAGSS RIDIFSDGGG RRKIVIADDG 
SGMTAADLAL AVDRHATSKL DDEDLLQIRT LGFRGEALPS IGAVAKLSIT TRHASEPHAW 
TLRVEGGDKT PIAPAALSQG TRVEVADLFF ATPARLKFLK TDRTEAEAIR EVVRRLAMAR 
PDIAFTLAGE ERAPVTWAAA LPGAPGQLIR LGDILGADFR ANAIEVRAER EGVVVEGFAA 
SPALTKANAL GQYLFVNGRP VRDKLILGAV RAAYSDYLPR DRHPVVALFV TLDSREVDAN 
VHPAKTEVRF RNAGLVRALI VHALKDGLAR EGRRTAANSA GSVISTFRPA SMPPANWDWR 
ASPSYPVGGS AAPSFAERAQ AAFDVGAPSA DIRPTEVTPD LLDRPLGAAR TQIHETYIVS 
QTRDGLIVVD QHAAHERIVY ERLKASLEAN GVQRQILLIP DIVEMDEATV ERLVARGEEL 
AKFGLVIESF GPGAVAVRET PSLLGKTDAG GLLRDLAEHM AEWDEALPLE RRLMHVAATM 
ACHGSVRAGR VLKPEEMNAL LREMEATPNS GQCNHGRPTY VELTLTDIEK LFGRR