Gene Mpe_A2342 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A2342
Symbol
ID	4784562
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	2510537
End bp	2512552
Gene Length	2016 bp
Protein Length	671 aa
Translation table	11
GC content	68%
IMG OID	640090911
Product	DNA topoisomerase III
Protein accession	YP_001021533
Protein GI	124267529
COG category	[L] Replication, recombination and repair
COG ID	[COG0550] Topoisomerase IA
TIGRFAM ID	[TIGR01056] DNA topoisomerase III, bacteria and conjugative plasmid

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCGTGT TCCTGTGCGA GAAGCCGTCC CAGGGCAAGG ACATCGCCCG TGTGCTGGGT 
GCCGGTCAAC GCGGCAACGG CTGCTACAGC GGCGCGGGTG TCGTCGTGAC CTGGTGCATC 
GGTCATTTGG TGGAGGCGGT TCCGCCCGAA GGCTACGGCG AGCAATACAA GCGCTGGGCC 
ATCGAACAAC TGCCTATTCT TCCTGAGCGT TGGCGTGTCG AGCCCAAGGC GGCGACCGCA 
GCGCAATTCA AGGTCGTGCA GCAGCTCGTC GCCAAGGCGG GCGAGCTGGT GATCGCGACT 
GACGCCGACC GCGAGGGCGA GATGATCGCC CGCGAGATCA TCGACCTATG CGGCTACCGC 
GGGCCGATTC AGCGCCTGTG GCTGTCGGCG CTCAACGATG CGTCGATCCG CAAAGCGCTG 
GGTGCGCTCA AGCCGTCCGA CGAGACGCTG CCGCTGTATT TCTCCGCACT CGCCCGATCG 
CGCGCCGACT GGCTGATTGG GATGAACCTG AGCCGCTTGT TCACACTGCT GGGGCGCCAG 
GCCGGCTATA CCGGCGTGCT GTCGGTGGGG CGCGTGCAGA CGCCGACGCT GAAGTTGGTC 
GTGGACCGCG ATCGCGAGAT CGCGCGATTC GTCTGCGTAC CGTTCTGGGC CATCGAGGTT 
GCGCTTTCGC ATGCAGGCCA GTCCTTCGTC GCAAGCTGGA CGCCGCCGCA AGGCAGCGCC 
GACGACGCCG ACCGCTGCTT GCAGCAGCCG GTGGCGCAGC AGGCAGCGGA ATTCCTGCGC 
GCGGCCGGCA CCGCCCAGGT GCTGTCGGTG GAGACCGAGC GCGTGCGCGA AGGGCCGCCG 
CTGCCGTTCG ACCTGGGCAC GCTGCAGGAG GTGTGCTCCA AGCAGTTGGG CCTCGACGTG 
CAGGAGACGC TGGACATTGC CCAGGCGCTG TACGAGACGC ACAAGGCGAC AACGTATCCG 
CGCTCGGATT CGGGCTACCT GCCCGAGAGC ATGCTGGCCG AGGTGCCGAC GGTACTCAAC 
AGCCTGGTCA AGACCGACCC CAGCTTGCGG CCGCTGATCG AGCGCCTGGA TCGCCAACAG 
CGTTCGCGTG CATGGAACGA CGGCAAGGTG TCGGCTCACC ACGGCATCAT CCCGACGCTG 
GAGCCCGCCA ACCTGTCGGC CATGAACGAG AAGGAACTGG CCGTCTACCG GCTGATCCGC 
GCTCATTACC TCGCGCAGTT CCTCCCACAC CATGAGTTCG ACCGGACGGT GGCGCAGTTC 
TCGTGCGGCA GTCAGTCGCT GGCGGCCGTG GGCAAGCAGA TCGCCGTCAT CGGCTGGCGT 
GAGGTGCTGG CGACGCCGGG GCCGGACGAT GCCGATGGCG AGGATGCGCA GCGCAGCCAG 
GTGCTGCCCG CCCTGCATGC GGGCCTGTCC TGCCCGGTCG GAAAGGTGGA TCTCAAGGCG 
CTGAAGACGC TGCCGCCCAA ACCCTACACG CAGGGCGAGC TGATCAAGGC CATGAAGACC 
GTCGCCAAGC TCGTGACCGA CCCGCGCCTG AAGCAGAAGC TGCGAGATAC CACCGGCATC 
GGCACCGAGG CGACACGCGC CAACATCATC AACGGTCTGA TCGGTCGCGG CTACCTGGTC 
AAGAAAGGCC GCGCCGTCCG CGCTTCCGAC GCGGCATTCA CGCTCATCGA CGCGGTGCCC 
TCAGCCATCG CCGACCCCGG CACCACGGCG GTGTGGGAGC AGGCGCTCGA CATGATCGAG 
GCCGGCCAGA TGACGCTGGA CACCTTCATC GAGAAGCAGT CCGTGTGGGT CGGCCAGCTC 
GTGCAGCAGT ACCGCGGCGC AACGCTCTCG CTCAAGCTGC CGCCGGCGCC GGCCTGCCCG 
CAGTGCGCCG CACCGATGCA GCAGCGCACG GGCAAGAGCG GCGCGTTCTG GTCCTGCTCG 
CGCTACCCGG ACTGCAAGGG CACGTTGCCG ATCGAGTCCC CGACGGGCCG GCGCAGCGCA 
CCGCGCAAGC GGCGCGCTGC CTCCAAGGCG TCCTGA

Protein sequence

MRVFLCEKPS QGKDIARVLG AGQRGNGCYS GAGVVVTWCI GHLVEAVPPE GYGEQYKRWA 
IEQLPILPER WRVEPKAATA AQFKVVQQLV AKAGELVIAT DADREGEMIA REIIDLCGYR 
GPIQRLWLSA LNDASIRKAL GALKPSDETL PLYFSALARS RADWLIGMNL SRLFTLLGRQ 
AGYTGVLSVG RVQTPTLKLV VDRDREIARF VCVPFWAIEV ALSHAGQSFV ASWTPPQGSA 
DDADRCLQQP VAQQAAEFLR AAGTAQVLSV ETERVREGPP LPFDLGTLQE VCSKQLGLDV 
QETLDIAQAL YETHKATTYP RSDSGYLPES MLAEVPTVLN SLVKTDPSLR PLIERLDRQQ 
RSRAWNDGKV SAHHGIIPTL EPANLSAMNE KELAVYRLIR AHYLAQFLPH HEFDRTVAQF 
SCGSQSLAAV GKQIAVIGWR EVLATPGPDD ADGEDAQRSQ VLPALHAGLS CPVGKVDLKA 
LKTLPPKPYT QGELIKAMKT VAKLVTDPRL KQKLRDTTGI GTEATRANII NGLIGRGYLV 
KKGRAVRASD AAFTLIDAVP SAIADPGTTA VWEQALDMIE AGQMTLDTFI EKQSVWVGQL 
VQQYRGATLS LKLPPAPACP QCAAPMQQRT GKSGAFWSCS RYPDCKGTLP IESPTGRRSA 
PRKRRAASKA S