Gene EcSMS35_A0073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_A0073
Symbol	sopA
ID	6106519
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010488
Strand	-
Start bp	54635
End bp	55810
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	47%
IMG OID	641614820
Product	plasmid-partitioning protein SopA
Protein accession	YP_001739961
Protein GI	170650895
COG category	[D] Cell cycle control, cell division, chromosome partitioning
COG ID	[COG1192] ATPases involved in chromosome partitioning
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.0000728582
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTCAGAA TGAGACTCAT GGAAACACTT AACCAGTGCA TAAACGCTGG TCATGAAATG 
ACGAAGGCTA TCGCCATTGC ACAGTTTAAT GATGACAGCC CGGAAGCGAG GAAAATCACC 
CGACGCTGGA GAATAGGTGA AGCAGCGGAT TTAGTTGGAG TATCTTCTCA GGCTATCAGG 
GATGCCGAGA AAGCAGGCCG GCTACCGCAC CCGGATATGG AAATACGAGG ACGGGTTGAG 
CAACGTGTTG GTTATACAAT TGAACAAATT AATCATATGC GTGACGTGTT TGGTACGAGA 
CTACGACGTG CTGAAGACGT ATTTCCGCCG GTGATTGGAG TTGCTGCTCA TAAAGGGGGC 
GTTTACAAAA CCTCTGTTTC TGTTCATCTT GCTCAGGATC TGGCTCTGAA GGGATTACGT 
GTTCTGCTCG TGGAAGGTAA CGACCCCCAG GGAACAGCAT CGATGTATCA CGGCTGGGTG 
CCAGATCTTC ATATTCATGC AGAGGATACT CTCCTTCCCT TCTATCTTGG GGAAAAGGAC 
GATGTCACTT ATGCAATAAA GCCTACTTGC TGGCCTGGGC TTGACATTAT TCCTTCCTGT 
TTGGCTCTGC ACCGCATTGA AACTGAGCTA ATGGGCAAAT TTGATGAAGG TAAATTGCCC 
ACCGATCCAC ACCTGATGCT CCGACTGGCC ATTGAAACCG TCGCTCATGA CTATGATGTC 
ATTGTCATTG ACAGCGCGCC TAACCTAGGT ATCGGCACGA TTAATGTTGT ATGTGCTGCT 
GATGTGTTGA TTGTCCCCAC GCCTGCTGAG TTGTTCGACT ACACTTCCGC TCTGCAGTTT 
TTCGATATGC TTCGTGATCT GCTCAAAAAC GTAGATCTTA AAGGATTCGA GCCTGATGTA 
CGTATTTTGC TTACCAAATA CAGTAATAGT AATGGTTCTC AGTCCCCGTG GATGGAGGAG 
CAAATTCGGG ACGCCTGGGG AAGCATGGTC CTAAAAAATG TTGTGCGTGA AACGGATGAA 
GTTGGTAAAG GTCAGATCCG GATGAGAACT GTTTTTGAAC AGGCTATTGA TCAACGCTCT 
TCAACAGGTG CCTGGAGAAA TGCCCTTTCT ATTTGGGAAC CTGTCTGCAA TGAAATTTTC 
GATCGTTTGA TTAAACCACG CTGGGAGATT AGATAA

Protein sequence

MFRMRLMETL NQCINAGHEM TKAIAIAQFN DDSPEARKIT RRWRIGEAAD LVGVSSQAIR 
DAEKAGRLPH PDMEIRGRVE QRVGYTIEQI NHMRDVFGTR LRRAEDVFPP VIGVAAHKGG 
VYKTSVSVHL AQDLALKGLR VLLVEGNDPQ GTASMYHGWV PDLHIHAEDT LLPFYLGEKD 
DVTYAIKPTC WPGLDIIPSC LALHRIETEL MGKFDEGKLP TDPHLMLRLA IETVAHDYDV 
IVIDSAPNLG IGTINVVCAA DVLIVPTPAE LFDYTSALQF FDMLRDLLKN VDLKGFEPDV 
RILLTKYSNS NGSQSPWMEE QIRDAWGSMV LKNVVRETDE VGKGQIRMRT VFEQAIDQRS 
STGAWRNALS IWEPVCNEIF DRLIKPRWEI R