Gene EcSMS35_4067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4067
Symbol	dnaA
ID	6146687
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	4158994
End bp	4160397
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	54%
IMG OID	641618892
Product	chromosomal replication initiation protein
Protein accession	YP_001746030
Protein GI	170679718
COG category	[L] Replication, recombination and repair
COG ID	[COG0593] ATPase involved in DNA replication initiation
TIGRFAM ID	[TIGR00362] chromosomal replication initiator protein DnaA

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0000102031
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCACTTT CGCTTTGGCA GCAGTGTCTT GCCCGATTGC AGGATGAGTT ACCAGCCACA 
GAATTCAGTA TGTGGATACG CCCATTGCAG GCGGAACTGA GCGATAACAC GCTGGCCCTG 
TACGCGCCAA ACCGTTTTGT CCTCGATTGG GTACGGGACA AGTACCTTAA TAATATCAAT 
GGACTGCTAA CCAGTTTCTG CGGAGCGGAT GCCCCACAGC TGCGTTTTGA AGTCGGCACC 
AAACCGGTGA CGCAAACGCC ACAAGCGGCA GTGACGAGCA ACGTCGCGGC CCCTGCACAG 
GTGGCGCAAA CGCAGCCGCA ACGTGCTGCG CCTTCTACGC GCTCGGGTTG GGATAACGTC 
CCGGCTCCGG CAGAACCGAC CTATCGTTCT AACGTAAACG TCAAACACAC GTTTGATAAC 
TTCGTTGAAG GTAAATCTAA CCAACTGGCG CGCGCGGCGG CTCGCCAGGT GGCAGATAAC 
CCTGGCGGTG CTTATAACCC GTTGTTCCTT TATGGCGGCA CGGGTTTGGG TAAAACTCAC 
CTGCTGCATG CGGTGGGTAA CGGCATTATG GCGCGCAAGC CGAATGCCAA AGTGGTTTAT 
ATGCACTCCG AGCGCTTTGT TCAGGACATG GTTAAAGCCC TGCAAAACAA CGCGATCGAA 
GAGTTTAAAC GCTACTACCG TTCCGTAGAT GCACTGCTGA TCGACGATAT TCAGTTTTTT 
GCTAATAAAG AACGATCTCA GGAAGAGTTT TTCCACACCT TCAACGCCCT GCTGGAAGGT 
AATCAACAGA TCATTCTCAC CTCCGATCGC TATCCGAAAG AGATCAACGG CGTTGAGGAT 
CGTTTGAAAT CCCGCTTCGG CTGGGGACTG ACTGTGGCGA TCGAACCGCC AGAGCTGGAA 
ACCCGCGTGG CGATCCTGAT GAAAAAGGCC GACGAAAACG ACATTCGTTT GCCGGGCGAA 
GTGGCGTTCT TTATCGCCAA GCGTCTACGA TCTAACGTAC GTGAGCTGGA AGGCGCGCTG 
AACCGCGTTA TTGCTAACGC CAACTTTACC GGACGTGCGA TCACCATCGA CTTCGTGCGT 
GAGGCGCTGC GCGACTTGCT GGCATTGCAG GAAAAACTGG TCACCATCGA CAATATTCAG 
AAGACGGTGG CGGAGTACTA CAAGATCAAA GTCGCGGATC TCCTTTCCAA GCGTCGATCC 
CGCTCGGTGG CGCGTCCGCG CCAGATGGCG ATGGCGCTGG CAAAAGAACT GACTAACCAC 
AGTCTGCCGG AGATTGGCGA TGCGTTTGGT GGCCGTGACC ACACGACGGT GCTTCATGCC 
TGCCGTAAGA TCGAGCAGCT GCGTGAAGAG AGCCACGATA TCAAAGAAGA TTTTTCCAAT 
TTAATCAGAA CATTGTCATC GTAA

Protein sequence

MSLSLWQQCL ARLQDELPAT EFSMWIRPLQ AELSDNTLAL YAPNRFVLDW VRDKYLNNIN 
GLLTSFCGAD APQLRFEVGT KPVTQTPQAA VTSNVAAPAQ VAQTQPQRAA PSTRSGWDNV 
PAPAEPTYRS NVNVKHTFDN FVEGKSNQLA RAAARQVADN PGGAYNPLFL YGGTGLGKTH 
LLHAVGNGIM ARKPNAKVVY MHSERFVQDM VKALQNNAIE EFKRYYRSVD ALLIDDIQFF 
ANKERSQEEF FHTFNALLEG NQQIILTSDR YPKEINGVED RLKSRFGWGL TVAIEPPELE 
TRVAILMKKA DENDIRLPGE VAFFIAKRLR SNVRELEGAL NRVIANANFT GRAITIDFVR 
EALRDLLALQ EKLVTIDNIQ KTVAEYYKIK VADLLSKRRS RSVARPRQMA MALAKELTNH 
SLPEIGDAFG GRDHTTVLHA CRKIEQLREE SHDIKEDFSN LIRTLSS