Gene SbBS512_E3463 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E3463
Symbol	parE
ID	6269570
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	3218316
End bp	3220208
Gene Length	1893 bp
Protein Length	630 aa
Translation table	11
GC content	54%
IMG OID	641727348
Product	DNA topoisomerase IV subunit B
Protein accession	YP_001881797
Protein GI	187730460
COG category	[L] Replication, recombination and repair
COG ID	[COG0187] Type IIA topoisomerase (DNA gyrase/topo II, topoisomerase IV), B subunit
TIGRFAM ID	[TIGR01055] DNA topoisomerase IV, B subunit, proteobacterial

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCAAA CTTATAACGC TGATGCCATT GAGGTACTCA CCGGACTTGA GCCGGTTCGC 
CGCCGTCCGG GGATGTATAC CGATACCACT CGCCCTAACC ATTTGGGGCA AGAAGTCATT 
GATAACAGTG TGGATGAAGC ACTGGCGGGT CACGCAAAAC GCGTGGACGT TATTTTACAT 
GCTGACCAGT CGTTAGAAGT TATTGACGAT GGGCGCGGGA TGCCGGTGGA TATTCACCCG 
GAAGAGGGTG TACCGGCGGT TGAACTGATT CTTTGCCGTC TGCATGCAGG CGGTAAATTC 
TCTAACAAAA ATTACCAGTT CTCTGGCGGC CTGCATGGCG TGGGGATTTC GGTGGTTAAC 
GCCCTGTCGA AGCGCGTAGA AGTTAACGTG CGCCGCGATG GTCAGATTTA TAACATCGCC 
TTTGAAAATG GCGAAAAGGT GCAGGATTTA CAGGTTGTCG GCACTTGCGG TAAACGCAAT 
ACCGGCACCA GCGTCCATTT CTGGCCGGAT GAAACCTTCT TCGATAGCCC GCGTTTTTCT 
GTTTCACGCC TGACGCATGT GCTGAAAGCC AAAGCAGTAC TGTGCCCCGG CGTTGAGATT 
ACCTTTAAAG ATGAGATCAA CAACACCGAA CAGCGCTGGT GCTATCAGGA CGGTCTGAAT 
GATTACCTGG CGGAAGCGGT AAACGGTTTA CCGACGCTGC CAGAAAAACC GTTTATCGGT 
AATTTCGCTG GCGATACTGA AGCGGTGGAC TGGGCGCTAC TGTGGCTGCC GGAAGGCGGT 
GAATTGCTGA CCGAAAGCTA CGTCAACCTG ATCCCAACGA TGCAGGGCGG TACCCATGTT 
AATGGTCTGC GTCAGGGCCT GCTGGACGCG ATGCGTGAGT TCTGTGAATA CCGCAACATT 
CTGCCGCGCG GTGTAAAGCT GTCGGCGGAA GATATCTGGG ATCGCTGCGC CTATGTGCTG 
TCAGTAAAAA TGCAGGATCC GCAGTTTGCC GGGCAGACCA AAGAGCGTCT CTCTTCGCGT 
CAGTGCGCGG CATTCGTTTC TGGCGTGGTG AAAGATGCCT TTATCCTGTG GCTGAACCAG 
AACGTTCAGG CGGCGGAGTT GCTGGCAGAG ATGGCGATTT CCAGCGCCCA GCGTCGTATG 
CGTGCGGCTA AAAAAGTGGT GCGTAAAAAG CTGACCAGCG GTCCGGCGCT GCCTGGCAAA 
CTGGCTGACT GTACCGCGCA GGACCTTAAC CGCACCGAAC TGTTTCTTGT GGAAGGTGAC 
TCCGCAGGCG GATCTGCCAA GCAGGCGCGC GATCGCGAAT ATCAGGCGAT CATGCCACTG 
AAAGGTAAGA TCCTTAACAC CTGGGAAGTC TCTTCCGACG AAGTGCTGGC TTCGCAGGAA 
GTGCACGATA TTTCGGTAGC GATCGGTATC GATCCTGACA GCGACGATTT GAGCCAGCTT 
CGTTACGGCA AGATCTGTAT CCTGGCGGAT GCTGACTCCG ATGGTCTGCA CATTGCCACG 
CTGCTCTGCG CTTTGTTTGT AAAACACTTC CGCGCGTTGG TGAAACACGG TCACGTTTAC 
GTCGCACTGC CACCGCTCTA CCGTATTGAT CTCGGGAAAG AGGTTTATTA CGCGCTGACG 
GAAGAAGAGA AAGAGGGCGT ACTTGAGCAA TTAAAACGCA AGAAAGGCAA GCCGAACGTC 
CAGCGTTTTA AAGGTCTGGG GGAAATGAAC CCGATGCAAT TGCGCGAAAC CACGCTTGAT 
CCGAACACTC GCCGTCTGGT GCAGTTGACT ATCGATGATG AAGACGATCA GCGTACTGAC 
GCGATGATGG ACATGCTACT GGCGAAGAAA CGCTCGGAAG ATCGCCGCAA CTGGTTGCAA 
GAGAAAGGCG ACATGGCGGA GATTGAGGTT TAA

Protein sequence

MTQTYNADAI EVLTGLEPVR RRPGMYTDTT RPNHLGQEVI DNSVDEALAG HAKRVDVILH 
ADQSLEVIDD GRGMPVDIHP EEGVPAVELI LCRLHAGGKF SNKNYQFSGG LHGVGISVVN 
ALSKRVEVNV RRDGQIYNIA FENGEKVQDL QVVGTCGKRN TGTSVHFWPD ETFFDSPRFS 
VSRLTHVLKA KAVLCPGVEI TFKDEINNTE QRWCYQDGLN DYLAEAVNGL PTLPEKPFIG 
NFAGDTEAVD WALLWLPEGG ELLTESYVNL IPTMQGGTHV NGLRQGLLDA MREFCEYRNI 
LPRGVKLSAE DIWDRCAYVL SVKMQDPQFA GQTKERLSSR QCAAFVSGVV KDAFILWLNQ 
NVQAAELLAE MAISSAQRRM RAAKKVVRKK LTSGPALPGK LADCTAQDLN RTELFLVEGD 
SAGGSAKQAR DREYQAIMPL KGKILNTWEV SSDEVLASQE VHDISVAIGI DPDSDDLSQL 
RYGKICILAD ADSDGLHIAT LLCALFVKHF RALVKHGHVY VALPPLYRID LGKEVYYALT 
EEEKEGVLEQ LKRKKGKPNV QRFKGLGEMN PMQLRETTLD PNTRRLVQLT IDDEDDQRTD 
AMMDMLLAKK RSEDRRNWLQ EKGDMAEIEV