Gene BURPS1106A_2612 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2612
Symbol	mutS
ID	4903074
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	2572526
End bp	2575345
Gene Length	2820 bp
Protein Length	939 aa
Translation table	11
GC content	68%
IMG OID	640135839
Product	DNA mismatch repair protein MutS
Protein accession	YP_001066865
Protein GI	126454533
COG category	[L] Replication, recombination and repair
COG ID	[COG0249] Mismatch repair ATPase (MutS family)
TIGRFAM ID	[TIGR01070] DNA mismatch repair protein MutS

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCCGCA AAGCCATCGA CAACGGGCTT GACACGTGCG AATCGCGACC GAATCGACAC 
ATTGGCCGTC CGGCCAGCTT CGCGCGCCGT CCCGACAAGG TAAACTCTCA CCCAATTCCG 
TATACGCAGA CAGATATCCG CACGATGGCC ACCCAAATCG ACGCCTCCTC CGAAGCAGCA 
GCGGCTACGG CCGCCGCGCA GCACACGCCG ATGATGCAGC AGTACCTACG CATCAAGTCG 
GAGCACCCCG ACACGCTCGT GTTCTACCGG ATGGGCGACT TCTACGAGCT CTTCTTCGAA 
GACGCGGAAA AAGCCGCGCG TCTGCTCGAC CTGACGCTCA CGCAACGCGG CGCATCCGCC 
GGCACGCCGA TCAAGATGGC GGGCGTGCCG CATCACGCGG TCGAGCAATA CCTCGCGAAG 
CTCGTGAAAT TCGGCGAATC GGCGGCGATC TGCGAACAGA TCGGCGACCC CGCGACGTCG 
AAAGGCCCCG TCGAGCGCAA GGTCGTGCGC GTCGTGACGC CGGGCACGCT GACCGACGCC 
GCGCTGCTGT CCGACAAGAG CGACGTGTTT CTGCTCGCGC TGTGCGTCGG CCACAACAAA 
CGCGGCGTCG CGTCGAACAT CGGCCTCGCC TGGCTCAATC TCGCGAGCGG CGCGCTGCGG 
CTCGCCGAGC TCGCGCCGGA TCAGCTCGGC GCGGCGCTCG AGCGTATCCG GCCCGCCGAG 
ATTCTCGCGG CCGACGGCAC GATCGAATCG GTGCCGGCCG GCATGGGCGC GATCACGCGC 
GTGCCCGCGT GGCACTTCGA TATCGCGTCG GGCACGCAGC GCCTCTGCGA TCAGCTCGAA 
GTCGCAAGCC TCGACGGCTT CGGCGCGCAA GCACTCACGA GCGCGAACGG CGCGGCGGGC 
GCGCTGCTGA TCTACGCGGC GGCCACGCAG GGCCAGCAGC TTCGCCACGT GCGCAGCCTC 
AAGGTCGAAA ACGAATCCGA ATACATCGGG CTCGATCCGT CGACGCGGCG CAATCTCGAA 
CTCACCGAGA CGCTGCGCGG CACCGAATCG CCGACGCTCT ATTCGCTGCT CGACACCTGC 
TGCACCGCGA TGGGCAGCCG CCTGTTGCGC CATTGGCTGC ATCATCCGCC GCGCGCGTCG 
GTCGCCGCGC AGGCGCGCCA TCAGGCAATC GGCGCGCTGC TCGACGCCCC CCCGAACGCC 
GGCCTCGACA GCCTGCGCTC GGCGCTGCGG CAAATCGCCG ACGTCGAGCG GATCACCGGC 
CGCCTCGCGC TGCTATCCGC GCGGCCACGC GATCTGTCCA GCCTGCGCGA CACGTTCGCC 
GCCCTGCCCG CGCTGCGCGA GCGCGTTGCC GAGATCGCAT CGAACGCGGC CGCGCTCGGC 
CGCCTCGAAG CCGCGCTCGA GCCGCCGCCC GGTTGCCTCG ATCTGCTCAC GCGCGCCATC 
GCGGCCGAGC CGGCGGCGAT GGTGCGCGAC GGCGGCGTGA TCGCCCGGGG CTACGACGCC 
GAGCTCGACG AGTTGCGCGA CATTTCGGAG AACTGCGGCC AGTTCCTGAT CGATCTCGAA 
ACGCGCGAGC GCGCACGCAC CGGCATTTCG AACCTGCGCG TCGAGTACAA CAAGGTCCAC 
GGTTTCTATA TCGAAGTCAC GCGCGGCCAG ACCGACAAGG TGCCCGACGA CTACCGCCGC 
CGCCAGACGC TCAAGAACGC CGAGCGCTAC ATCACGCCCG AGCTGAAGAC GTTCGAGGAC 
AAGGCGCTGT CCGCGCAGGA ACGCGCGCTC GCTCGCGAAC GCGCGCTGTA CGACGGCGTG 
CTGCAGGCGC TCCTGCCCCA TATCGAGGGT TGCCAGCGCG TCGCAAGCGG CCTCGCGGAA 
CTCGATCTGC TCGCGGCGTT CGCCGAGCGC GCCCGCACGC TCGACTGGGT AGCGCCGGAA 
TTCACCGACG AGATCGGCAT CGAAATCGAT CAGGGCCGCC ATCCGGTCGT CGAGGCACAG 
GTCGAGCAAT TCATCGCGAA CGATTGCGCC CTGAACCCCG AGCGAAAGCT GCTCCTCATC 
ACCGGCCCGA ACATGGGCGG TAAATCGACG TTCATGCGTC AGACCGCGCT CATCGCGCTG 
ATGGCGTACG TCGGCAGCTA CGTGCCGGCG AAAGCCGCGC GCTTCGGCCC CATCGACCGC 
ATCTTCACGC GCATCGGCGC GGCGGACGAC CTCGCGGGCG GCCGCTCGAC GTTCATGGTC 
GAAATGACGG AGGCCGCCGC GATCCTGAAC GACGCAACGC CGCACAGCCT CGTGCTGATG 
GACGAAATCG GCCGCGGCAC ATCGACGTTC GACGGCCTCG CGCTCGCCTG GGCGATCGCA 
CGCCATCTGC TGTCGCACAA TCGCTGCTAC ACGCTGTTCG CGACGCACTA CTTCGAGCTC 
ACGCAACTGC CGGCGGAATT CCCGCAGGCG GCGAACGTGC ATCTGTCCGC CGTCGAGCAC 
GGTCACGGCA TCGTATTCCT GCATGCGGTC GAGGAAGGGC CGGCGAATCA GAGCTACGGC 
CTGCAGGTCG CGCAGTTGGC AGGGGTTCCC GCGCCGGTGA TTCGCGCCGC GCGCAAGCAT 
CTCGAGCACC TCGAACAGCA GTCCGCCGCC CAGGCGACGC CGCAGCTCGA TCTCTTCGCC 
GCACCACCGG TCGTCGACGA GCCGGAATGC AACGAGCCCC CCGCCGCCGC GACGCCGCAC 
CCCGCGCTCG AGCGCCTGCT CGAGCTCGAT CCGGACGACT TGAAACCGCG CGACGCGCTC 
GATCTGCTTT ACGAACTTCA CACACTCGCC CGCTCGGGCC CGGCGGATGC GCAACGCTGA

Protein sequence

MGRKAIDNGL DTCESRPNRH IGRPASFARR PDKVNSHPIP YTQTDIRTMA TQIDASSEAA 
AATAAAQHTP MMQQYLRIKS EHPDTLVFYR MGDFYELFFE DAEKAARLLD LTLTQRGASA 
GTPIKMAGVP HHAVEQYLAK LVKFGESAAI CEQIGDPATS KGPVERKVVR VVTPGTLTDA 
ALLSDKSDVF LLALCVGHNK RGVASNIGLA WLNLASGALR LAELAPDQLG AALERIRPAE 
ILAADGTIES VPAGMGAITR VPAWHFDIAS GTQRLCDQLE VASLDGFGAQ ALTSANGAAG 
ALLIYAAATQ GQQLRHVRSL KVENESEYIG LDPSTRRNLE LTETLRGTES PTLYSLLDTC 
CTAMGSRLLR HWLHHPPRAS VAAQARHQAI GALLDAPPNA GLDSLRSALR QIADVERITG 
RLALLSARPR DLSSLRDTFA ALPALRERVA EIASNAAALG RLEAALEPPP GCLDLLTRAI 
AAEPAAMVRD GGVIARGYDA ELDELRDISE NCGQFLIDLE TRERARTGIS NLRVEYNKVH 
GFYIEVTRGQ TDKVPDDYRR RQTLKNAERY ITPELKTFED KALSAQERAL ARERALYDGV 
LQALLPHIEG CQRVASGLAE LDLLAAFAER ARTLDWVAPE FTDEIGIEID QGRHPVVEAQ 
VEQFIANDCA LNPERKLLLI TGPNMGGKST FMRQTALIAL MAYVGSYVPA KAARFGPIDR 
IFTRIGAADD LAGGRSTFMV EMTEAAAILN DATPHSLVLM DEIGRGTSTF DGLALAWAIA 
RHLLSHNRCY TLFATHYFEL TQLPAEFPQA ANVHLSAVEH GHGIVFLHAV EEGPANQSYG 
LQVAQLAGVP APVIRAARKH LEHLEQQSAA QATPQLDLFA APPVVDEPEC NEPPAAATPH 
PALERLLELD PDDLKPRDAL DLLYELHTLA RSGPADAQR