Gene EcE24377A_E0022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_E0022
Symbol	sopA
ID	5585882
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009790
Strand	-
Start bp	20998
End bp	22164
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	47%
IMG OID	640913913
Product	plasmid-partitioning protein SopA
Protein accession	YP_001451563
Protein GI	157149534
COG category	[D] Cell cycle control, cell division, chromosome partitioning
COG ID	[COG1192] ATPases involved in chromosome partitioning
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.19504
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACTCA TGGAAACACT TAACCAGTGC ATAAACGCTG GTCATGAAAT GACGAAGGCT 
ATCGCCATTG CACAGTTTAA TGATGACAGC CCGGAAGCGA GGAAAATAAC CCGGCGCTGG 
AGAATAGGTG AAGCAGCGGA TTTAGTTGGG GTTTCTTCTC AGGCTATCAG AGATGCCGAG 
AAAGCAGGGC GACTACCGCA CCCGGATATG GAAATTCGAG GACGGGTTGA GCAACGTGTT 
GGTTATACAA TTGAACAAAT TAATCATATG CGTGATGTGT TTGGTACGCG ATTGCGACGT 
GCTGAAGACG TATTTCCACC GGTGATCGGG GTTGCTGCCC ATAAAGGTGG CGTTTACAAA 
ACCTCAGTTT CTGTTCATCT TGCTCAGGAT CTGGCTCTGA AGGGGCTACG TGTTTTGCTC 
GTGGAAGGTA ACGACCCCCA GGGAACAGCC TCAATGTATC ACGGATGGGT ACCAGATCTT 
CATATTCATG CAGAAGACAC TCTCCTGCCT TTCTATCTTG GGGAAAAGGA CGATGTCACT 
TATGCAATAA AGCCCACTTG CTGGCCGGGG CTTGACATTA TTCCTTCCTG TCTGGCTCTG 
CACCGTATTG AAACTGAGTT AATGGGCAAA TTTGATGAAG GTAAACTGCC CACCGATCCA 
CACCTGATGC TCCGACTGGC CATTGAAACT GTTGCTCATG ACTATGATGT CATAGTTATT 
GACAGCGCGC CTAACCTGGG TATCGGCACG ATTAATGTCG TATGTGCTGC TGATGTGCTG 
ATTGTTCCCA CGCCTGCTGA GTTGTTTGAC TACACCTCCG CACTGCAGTT TTTCGATATG 
CTTCGTGATC TGCTCAAGAA CGTTGATCTT AAAGGGTTCG AGCCTGATGT ACGTATTTTG 
CTTACCAAAT ACAGCAATAG TAATGGCTCT CAGTCCCCGT GGATGGAGGA GCAAATTCGG 
GATGCCTGGG GAAGCATGGT TCTAAAAAAT GTTGTACGTG AAACGGATGA AGTTGGTAAA 
GGTCAGATCC GGATGAGAAC TGTTTTTGAA CAGGCCATTG ATCAACGCTC TTCAACTGGT 
GCCTGGAGAA ATGCTCTTTC TATTTGGGAA CCTGTCTGCA ATGAAATTTT CGATCGTCTG 
ATTAAACCAC GCTGGGAGAT TAGATAA

Protein sequence

MKLMETLNQC INAGHEMTKA IAIAQFNDDS PEARKITRRW RIGEAADLVG VSSQAIRDAE 
KAGRLPHPDM EIRGRVEQRV GYTIEQINHM RDVFGTRLRR AEDVFPPVIG VAAHKGGVYK 
TSVSVHLAQD LALKGLRVLL VEGNDPQGTA SMYHGWVPDL HIHAEDTLLP FYLGEKDDVT 
YAIKPTCWPG LDIIPSCLAL HRIETELMGK FDEGKLPTDP HLMLRLAIET VAHDYDVIVI 
DSAPNLGIGT INVVCAADVL IVPTPAELFD YTSALQFFDM LRDLLKNVDL KGFEPDVRIL 
LTKYSNSNGS QSPWMEEQIR DAWGSMVLKN VVRETDEVGK GQIRMRTVFE QAIDQRSSTG 
AWRNALSIWE PVCNEIFDRL IKPRWEIR