Gene ECH74115_3643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3643
Symbol	zipA
ID	6970557
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3358743
End bp	3359741
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	55%
IMG OID	643387438
Product	cell division protein ZipA
Protein accession	YP_002271891
Protein GI	209400232
COG category	[D] Cell cycle control, cell division, chromosome partitioning
COG ID	[COG3115] Cell division protein
TIGRFAM ID	[TIGR02205] cell division protein ZipA

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000110035
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	65
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCAGG ATTTGCGTCT GATATTAATC ATTGTTGGCG CGATCGCCAT AATCGCTTTA 
CTGGTACATG GTTTCTGGAC CAGCCGTAAA GAACGATCTT CTATGTTCCG CGATCGGCCA 
TTAAAACGAA TGAAGTCAAA ACGTGACGAC GATTCTTATG ACGAGGATGT CGAAGATGAT 
GAGGGCGTTG GTGAGGTTCG TGTTCACCGC GTGAATCATG CCCCGGCTAA CGCCCAGGAG 
CATGAGGCTG CTCGTCCGTC GCCGCAACAC CAGTACCAAC CGCCTTATGC GTCTGCGCAG 
CCGCGTCAAC CGGTCCAGCA GCCGCCTGAA GCGCAGGTAC CGCCGCAACA TGCTCCGCGT 
CCAGCGCAGC CGGTGCAGCA ACCCGTGCAG CAGCCTGCCT ATCAGCCGCA GCCTGAACAG 
CCGTTGCAGC AGCCAGTTTC GCCACAGGTC GCGCCAGCGC CGCAGCCAGT GCATTCAGCA 
CCGCAACCGG CACAACAGGC TTTCCAGCCT GCAGAACCCG TAGCGGCACC ACAGCCTGAG 
CCTGTAGCGG AACCGGCTCC AGTTATGGAT AAACCGAAGC GCAAAGAAGC GGTGATTATC 
ATGAACGTCG CGGCGCATCA CGGTAGCGAG CTAAACGGTG AACTGCTTCT TAACAGCATT 
CAACAAGCGG GCTTCATTTT TGGCGATATG AATATTTACC ATCGTCATCT TAGCCCGGAT 
GGCAGCGGCC CGGCGTTATT TAGCCTGGCG AATATGGTGA AACCGGGAAC CTTTGATCCT 
GAAATGAAGG ATTTCACTAC TCCGGGTGTC ACTATCTTTA TGCAGGTACC GTCTTACGGT 
GACGAGCTGC AGAACTTCAA GCTGATGCTG CAATCTGCGC AGCATATTGC CGATGAAGTG 
GGCGGTGTCG TGCTTGACGA TCAGCGCCGT ATGATGACTC CGCAGAAATT GCGCGAGTAC 
CAGGACATCA TCCGCGAAGT TAAAGACGCC AACGCCTGA

Protein sequence

MMQDLRLILI IVGAIAIIAL LVHGFWTSRK ERSSMFRDRP LKRMKSKRDD DSYDEDVEDD 
EGVGEVRVHR VNHAPANAQE HEAARPSPQH QYQPPYASAQ PRQPVQQPPE AQVPPQHAPR 
PAQPVQQPVQ QPAYQPQPEQ PLQQPVSPQV APAPQPVHSA PQPAQQAFQP AEPVAAPQPE 
PVAEPAPVMD KPKRKEAVII MNVAAHHGSE LNGELLLNSI QQAGFIFGDM NIYHRHLSPD 
GSGPALFSLA NMVKPGTFDP EMKDFTTPGV TIFMQVPSYG DELQNFKLML QSAQHIADEV 
GGVVLDDQRR MMTPQKLREY QDIIREVKDA NA