Gene SNSL254_A1409 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A1409
Symbol	topB
ID	6483297
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	1378627
End bp	1380576
Gene Length	1950 bp
Protein Length	649 aa
Translation table	11
GC content	56%
IMG OID	642736801
Product	DNA topoisomerase III
Protein accession	YP_002040555
Protein GI	194442516
COG category	[L] Replication, recombination and repair
COG ID	[COG0550] Topoisomerase IA
TIGRFAM ID	[TIGR01056] DNA topoisomerase III, bacteria and conjugative plasmid

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0199719
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	69
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGTTGT TTATTGCCGA AAAACCGAGT CTGGGGCGCG CCATTGCGGA TGTGCTGCCA 
AAACCGCACC GTAAAGGCGA TGGTTTTATT GAGTGCGGAA ACGGGCAGGT CGTCACCTGG 
TGTATCGGTC ATTTGCTGGA ACAGGCGCAG CCGGATGCGT ATGACAGCCG TTATGCGCGC 
TGGAATCTGG CTGACCTGCC TATCGTGCCG GAAAAATGGC AGCTTCAGCC TCGTCCTTCC 
GTCACCAAAC AGCTCAATGT GATTAAGCGC TTTTTGCATC AAGCCGGTGA AATTATTCAC 
GCTGGCGACC CGGATCGCGA AGGGCAGCTT CTGGTTGATG AAGTGCTGGA TTATCTCCAG 
CTTCCTGCCG AAAAGCGCCA GCAGGTGCGG CGTTGTCTGA TAAACGACCT TAACCCGCAG 
GCGGTCGAGC GTGCTATTGA CAGGCTGCGG GCGAACAGCG ACTTCGTGCC GCTGTGCGTC 
TCCGCGCTGG CGCGAGCGCG AGCGGACTGG CTGTATGGCA TTAATATGAC CCGCGCTTAC 
ACGATCCTGG GCCGGAATGC CGGCTATCAG GGCGTGTTAT CCGTGGGACG CGTACAGACT 
CCGGTACTGG GGCTGGTGGT GCGGCGAGAC GAAGAGATTG AGAACTTCGT CGCCAAAGAC 
TTCTTTGAAG TAAAGGCGCA CATCGTTACG CCTGCCGACG AGCGTTTTAC CGCTATCTGG 
CAGCCGAGCG AGGCGTGCGA ACCTTATCAG GATGAAGAGG GGCGCTTGCT TCATCGTCCG 
CTGGCGGAGC ATGTAGTGAA CCGAATCAAC GGTCAGCCCG CGCTGGTAAC CAGTTATAAT 
GATAAACGGG AATCAGAATC CGCGCCGCTG CCGTTTTCGC TCTCGACGCT ACAGATTGAA 
GCCGCCAAAC GCTTTGGCCT GAGCGCGCAA AACGTGCTTG ATATTTGTCA GAAGCTCTAT 
GAAACCCACA AACTGATTAC CTATCCGCGT TCCGACTGCC GTTATCTGCC GGAAGAACAC 
TTTGCCGGAC GGCAGGCGGT CATGAACGCG ATTAGCGTCC ACGCCCCGGA TTTACTGCCG 
CAGCCTGTGG TTAATCCTGA TACGCGCAAT CGCTGCTGGG ATGACAAAAA AGTGGATGCG 
CACCACGCGA TTATCCCGAC GGCGCGCAGT TCTTCTGTCC ATCTGACGGA AAACGAAGCG 
AAAGTGTACA CCCTGATTGC GCGTCAGTAT CTGATGCAGT TCTGCCCGGA CGCGGTGTTT 
CGTAAATGCG TTATTGAACT GGAAATCGCC AAAGGGAAAT TTGTCGCCAA AGCGCGTTTT 
CTGGCGGAGG CCGGTTGGCG GACGTTACTG GGCAGTAAAG AGCGCGACGA GGAAAACGAC 
GGTACGCCGC TGCCGGTTGT CGCCAAAGGT GATGAGTTGC TGTGTGAAAA GGGGGAAGTG 
GTCGAGCGCC AAACCCAGCC GCCGCGTCAT TTTACTGATG CGACATTGCT TTCCGCGATG 
ACCGGAATTG CCCGCTTCGT GCAGGATAAA GATCTGAAAA AGATCCTGCG CGCGACCGAT 
GGGCTGGGGA CGGAAGCCAC GCGCGCCGGG ATTATCGAGC TGCTGTTCAA ACGTAGCTTT 
CTGACCAAAA AAGGGCGCTA CATTCATTCT ACCGATGCTG GCAAAGCGTT AATACATTCG 
CTGCCGGAAA TGGCGGCCCG TCCAGATATG ACCGCGCACT GGGAATCTGT TTTGACGCAA 
ATCAGCGAAA AGCAGTGCCG TTACCAGGAT TTCATGCAAC CGCTGGTCGG CACGTTATAT 
CAGCTGATCG AGCAGGCTAA GCGCACGCCG GTGAAGCGCT TCAGAGGGAT AGTCGCGCCA 
GGCGGTGGAG ACAAGAAAAA GAGCGCGCCG CGTAAGCGAG CGGGCAAAAA AAGCCCGCCT 
GCTGAGGAGA CAGGCCGTCA GACCGAATAA

Protein sequence

MRLFIAEKPS LGRAIADVLP KPHRKGDGFI ECGNGQVVTW CIGHLLEQAQ PDAYDSRYAR 
WNLADLPIVP EKWQLQPRPS VTKQLNVIKR FLHQAGEIIH AGDPDREGQL LVDEVLDYLQ 
LPAEKRQQVR RCLINDLNPQ AVERAIDRLR ANSDFVPLCV SALARARADW LYGINMTRAY 
TILGRNAGYQ GVLSVGRVQT PVLGLVVRRD EEIENFVAKD FFEVKAHIVT PADERFTAIW 
QPSEACEPYQ DEEGRLLHRP LAEHVVNRIN GQPALVTSYN DKRESESAPL PFSLSTLQIE 
AAKRFGLSAQ NVLDICQKLY ETHKLITYPR SDCRYLPEEH FAGRQAVMNA ISVHAPDLLP 
QPVVNPDTRN RCWDDKKVDA HHAIIPTARS SSVHLTENEA KVYTLIARQY LMQFCPDAVF 
RKCVIELEIA KGKFVAKARF LAEAGWRTLL GSKERDEEND GTPLPVVAKG DELLCEKGEV 
VERQTQPPRH FTDATLLSAM TGIARFVQDK DLKKILRATD GLGTEATRAG IIELLFKRSF 
LTKKGRYIHS TDAGKALIHS LPEMAARPDM TAHWESVLTQ ISEKQCRYQD FMQPLVGTLY 
QLIEQAKRTP VKRFRGIVAP GGGDKKKSAP RKRAGKKSPP AEETGRQTE