Gene ECH74115_4344 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4344
Symbol	parE
ID	6970381
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	4022681
End bp	4024573
Gene Length	1893 bp
Protein Length	630 aa
Translation table	11
GC content	54%
IMG OID	643388071
Product	DNA topoisomerase IV subunit B
Protein accession	YP_002272509
Protein GI	209399667
COG category	[L] Replication, recombination and repair
COG ID	[COG0187] Type IIA topoisomerase (DNA gyrase/topo II, topoisomerase IV), B subunit
TIGRFAM ID	[TIGR01055] DNA topoisomerase IV, B subunit, proteobacterial

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCAAA CTTATAACGC TGATGCCATT GAGGTACTCA CCGGGCTTGA GCCGGTTCGC 
CGCCGTCCGG GGATGTATAC CGATACCACT CGCCCTAACC ATTTGGGGCA AGAAGTCATT 
GATAACAGTG TGGATGAAGC ACTGGCGGGT CACGCAAAAC GCGTGGACGT TATTTTACAT 
GCTGACCAGT CGTTAGAAGT TATTGACGAT GGGCGCGGGA TGCCGGTGGA TATTCACCCG 
GAAGAGGGTG TACCGGCGGT TGAACTGATT CTTTGCCGTC TGCATGCAGG CGGTAAATTC 
TCTAACAAAA ATTACCAGTT CTCTGGCGGC CTGCATGGCG TGGGGATTTC GGTGGTTAAC 
GCCCTGTCGA AGCGCGTAGA AGTTAACGTG CGCCGCGATG GTCAGGTTTA TAACATCGCC 
TTTGAAAATG GCGAAAAGGT GCAGGATTTA CAGGTTGTCG GCAATTGCGG TAAACGCAAT 
ACCGGCACCA GCGTCCATTT CTGGCCGGAT GAAACCTTCT TCGATAGCCC GCGTTTTTCT 
GTTTCACGCC TGACGCATGT GCTGAAAGCC AAAGCAGTAC TGTGCCCCGG CGTTGAGATT 
ACCTTTAAAG ATGAGATCAA CAACACCGAA CAGCGCTGGT GCTATCAGGA CGGTCTGAAT 
GATTACCTGG CGGAAGCGGT AAACGGTTTA CCGACGCTGC CAGAAAAACC GTTTATCGGT 
AATTTCGCTG GCGATACTGA AGCGGTGGAC TGGGCGCTAC TGTGGCTGCC GGAAGGCGGT 
GAACTGCTGA CCGAAAGCTA CGTCAACCTG ATCCCAACGA TGCAGGGCGG TACCCATGTT 
AATGGCCTGC GTCAGGGCCT GCTGGACGCG ATGCGTGAGT TCTGTGAATA CCGCAACATT 
TTGCCGCGCG GTGTAAAGTT GTCGGCGGAA GATATCTGGG ATCGCTGCGC CTATGTGCTG 
TCAGTAAAAA TGCAGGATCC ACAGTTTGCC GGGCAGACCA AAGAGCGTCT CTCTTCGCGT 
CAGTGTGCGG CATTCGTTTC GGGCGTGGTG AAAGATGCCT TCATCCTGTG GCTGAACCAG 
AACGTTCAGG CGGCGGAGTT GCTGGCAGAG ATGGCGATTT CCAGCGCCCA GCGTCGTATG 
CGTGCGGCTA AAAAAGTGGT GCGTAAAAAG CTGACCAGCG GCCCGGCGCT GCCTGGCAAA 
CTGGCTGATT GTACCGCGCA GGACCTTAAC CGTACCGAAC TGTTCCTCGT GGAAGGTGAC 
TCCGCAGGCG GATCTGCCAA GCAGGCGCGC GATCGCGAAT ATCAGGCGAT CATGCCGCTG 
AAAGGTAAGA TCCTTAACAC CTGGGAAGTT TCTTCCGACG AAGTGCTGGC CTCGCAGGAA 
GTGCATGATA TTTCGGTAGC GATCGGTATC GATCCTGACA GCGACGATCT GAGCCAGCTT 
CGTTATGGCA AAATCTGTAT CCTCGCGGAT GCGGACTCTG ATGGTTTGCA CATTGCTACA 
CTGCTCTGCG CTTTGTTCGT AAAACACTTC CGCGCGTTGG TGAAACACGG TCACGTTTAC 
GTCGCACTGC CACCGCTCTA CCGTATTGAT CTCGGGAAAG AGGTTTATTA CGCGCTGACG 
GAAGAAGAGA AAGAGGGCGT ACTTGAGCAA TTAAAACGCA AGAAAGGCAA GCCGAACGTC 
CAGCGTTTTA AAGGTCTGGG GGAAATGAAC CCGATGCAAT TGCGCGAAAC CACGCTTGAT 
CCGAACACTC GCCGTCTGGT GCAGCTGACT ATCGATGATG AAGACGATCA GCGTACTGAC 
GCGATGATGG ATATGCTGCT GGCGAAGAAA CGCTCGGAAG ATCGCCGCAA CTGGTTGCAA 
GAGAAAGGCG ACATGGCGGA GATTGAGGTC TGA

Protein sequence

MTQTYNADAI EVLTGLEPVR RRPGMYTDTT RPNHLGQEVI DNSVDEALAG HAKRVDVILH 
ADQSLEVIDD GRGMPVDIHP EEGVPAVELI LCRLHAGGKF SNKNYQFSGG LHGVGISVVN 
ALSKRVEVNV RRDGQVYNIA FENGEKVQDL QVVGNCGKRN TGTSVHFWPD ETFFDSPRFS 
VSRLTHVLKA KAVLCPGVEI TFKDEINNTE QRWCYQDGLN DYLAEAVNGL PTLPEKPFIG 
NFAGDTEAVD WALLWLPEGG ELLTESYVNL IPTMQGGTHV NGLRQGLLDA MREFCEYRNI 
LPRGVKLSAE DIWDRCAYVL SVKMQDPQFA GQTKERLSSR QCAAFVSGVV KDAFILWLNQ 
NVQAAELLAE MAISSAQRRM RAAKKVVRKK LTSGPALPGK LADCTAQDLN RTELFLVEGD 
SAGGSAKQAR DREYQAIMPL KGKILNTWEV SSDEVLASQE VHDISVAIGI DPDSDDLSQL 
RYGKICILAD ADSDGLHIAT LLCALFVKHF RALVKHGHVY VALPPLYRID LGKEVYYALT 
EEEKEGVLEQ LKRKKGKPNV QRFKGLGEMN PMQLRETTLD PNTRRLVQLT IDDEDDQRTD 
AMMDMLLAKK RSEDRRNWLQ EKGDMAEIEV