Gene EcSMS35_4513 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4513
Symbol	dnaB
ID	6145859
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4611881
End bp	4613296
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	54%
IMG OID	641619329
Product	replicative DNA helicase
Protein accession	YP_001746441
Protein GI	170683120
COG category	[L] Replication, recombination and repair
COG ID	[COG0305] Replicative DNA helicase
TIGRFAM ID	[TIGR00665] replicative DNA helicase

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGGAA ATAAACCCTT CAACAAACAG CAGGCTGAAC CCCGCGAACG CGATCCACAA 
GTTGCCGGGC TGAAAGTGCC TCCGCACTCG ATCGAAGCGG AGCAGTCGGT GTTGGGCGGT 
TTAATGCTGG ATAACGAACG CTGGGATGAT GTAGCCGAGC GTGTGGTGGC AGACGACTTT 
TACACCCGCC CACACCGTCA TATCTTTACT GAAATGGCGC GTTTGCAGGA AAGCGGTAGT 
CCTATCGATC TGATTACCCT TGCGGAATCG CTGGAACGCC AGGGGCAACT TGATAGCGTC 
GGTGGTTTCG CTTATCTGGC GGAGCTGTCA AAAAATACGC CAAGTGCGGC GAACATCAGT 
GCTTATGCTG ACATCGTGCG TGAACGTGCC GTTGTTCGCG AGATGATTTC GGTTGCGAAT 
GAGATTGCCG AAGCCGGTTT TGATCCGCAG GGGCGTACCA GCGAAGATCT GCTGGACCTG 
GCTGAATCCC GCGTCTTTAA AATTGCCGAA AGTCGTGCAA ACAAAGACGA AGGGCCGAAG 
AACATCGCCG ATGTGCTCGA CGCCACGGTG GCGCGTATTG AGCAGTTGTT TCAGCAGCCA 
CACGATGGCG TTACCGGGGT AAACACCGGT TATGACGATC TCAACAAAAA AACCGCTGGC 
TTGCAGCCGT CGGATTTGAT CATCGTCGCC GCGCGTCCGT CGATGGGTAA AACAACATTT 
GCGATGAACC TCGTCGAAAA CGCGGCGATG TTGCAGGATA AACCAGTACT TATCTTCTCG 
CTGGAGATGC CATCAGAACA GATTATGATG CGTTCTTTGG CGTCGCTGTC GCGCGTTGAC 
CAGACTAAAA TCCGTACCGG GCAGCTCGAT GATGAAGACT GGGCACGTAT TTCCGGCACC 
ATGGGTATTT TGCTCGAAAA ACGCAATATC TATATCGATG ACTCCTCCGG CCTGACGCCA 
ACGGAAGTGC GTTCCCGCGC ACGCCGTATT GCCCGTGAAC ACGGCGGCAT CGGGCTTATC 
ATGATCGACT ACCTGCAACT GATGCGCGTA CCGGCGCTTT CCGATAACCG TACGCTGGAA 
ATTGCAGAAA TCTCCCGCTC GCTGAAAGCA CTGGCGAAAG AACTGAACGT GCCGGTGGTG 
GCGCTGTCCC AGTTGAACCG TTCTCTGGAA CAACGTGCCG ACAAACGCCC GGTCAACTCC 
GACCTGCGTG AATCTGGCTC TATCGAGCAG GATGCGGACT TGATCATGTT TATCTATCGT 
GATGAGGTGT ATCACGAAAA CAGTGATTTA AAAGGCATCG CGGAAATTAT TATCGGTAAA 
CAACGTAACG GCCCAATCGG GACGGTACGC CTGACCTTTA ACGGTCAATG GTCGCGCTTC 
GACAACTATG CGGGGCCGCA GTACGACGAC GAATAA

Protein sequence

MAGNKPFNKQ QAEPRERDPQ VAGLKVPPHS IEAEQSVLGG LMLDNERWDD VAERVVADDF 
YTRPHRHIFT EMARLQESGS PIDLITLAES LERQGQLDSV GGFAYLAELS KNTPSAANIS 
AYADIVRERA VVREMISVAN EIAEAGFDPQ GRTSEDLLDL AESRVFKIAE SRANKDEGPK 
NIADVLDATV ARIEQLFQQP HDGVTGVNTG YDDLNKKTAG LQPSDLIIVA ARPSMGKTTF 
AMNLVENAAM LQDKPVLIFS LEMPSEQIMM RSLASLSRVD QTKIRTGQLD DEDWARISGT 
MGILLEKRNI YIDDSSGLTP TEVRSRARRI AREHGGIGLI MIDYLQLMRV PALSDNRTLE 
IAEISRSLKA LAKELNVPVV ALSQLNRSLE QRADKRPVNS DLRESGSIEQ DADLIMFIYR 
DEVYHENSDL KGIAEIIIGK QRNGPIGTVR LTFNGQWSRF DNYAGPQYDD E