Gene ECH74115_0900 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0900
Symbol	clpP
ID	6967957
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	911487
End bp	913445
Gene Length	1959 bp
Protein Length	652 aa
Translation table	11
GC content	51%
IMG OID	643384922
Product	Clp protease domain protein
Protein accession	YP_002269422
Protein GI	209397527
COG category	[O] Posttranslational modification, protein turnover, chaperones [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0740] Protease subunit of ATP-dependent Clp proteases
TIGRFAM ID	[TIGR00493] ATP-dependent Clp protease, proteolytic subunit ClpP

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGGCTG GTCACCAGAG TGACGCGGAT ATTTATATTT ATGACGAGAT TGGTTTCTGG 
GGTGTTACAG CGAAGCAGTT TATCAGTGAT CTGAATGCAC TGGGCGATAT CACCCACATT 
AATCTCAATA TCAATTCACC GGGTGGCGAT GTCTTTGAAG GCATCGCCAT TTTTAATGCA 
CTGAAAACAC ATGGTGCGTC CATTACCGTT TATGTCGACG GTGTGGCGGC GTCAATGGCG 
TCGGTCATTG CGATGGTGGG AAAACCGGTC ATTATGCCGG AAAACTCCTT CATGATGATT 
CATAAACCAT TTGGCTTTAC GGGCGGTGAT GCGGAGGACA TGCGCACCTA TGCCGACCTG 
CTCGATAAAG TTGAGGCGGT TCTGTTACCC GCTTATGCAC AGAAAACCGG GAAAACCACC 
GATGAAATTG CTGCCATGCT GGCGGATGAG ACCTGGATGT CCGGTGCCGA ATGTCTGGCA 
CATGGATTTG CTGATCAGGT GACGCCAGCC GTTAAGGCAA TGGCATGTAT TCAGTCAAAA 
CGTACAGAGG AATTTAAAAA GATGCCGGAA TCCATTCGAA ACATGATTAC TCCGCCACGC 
AACAGTGCTC CACGCGTACA GGATGATGGA CCTGCAGCCT CCCGGACGCC AGTGCAGGCA 
GCAGCACCTG TGGTGGATGA AAACAGTATC CGTGCGCAGG TACTGGCAGA GCAAAAAGCG 
CGTGTAAACG GTATTAATGA TCTGTTTGCC ATGTTTGGCG GGCGTTATCA GACGCTGCAG 
GCTCAGTGTC TTGCCGATCC TGAATGTTCG CTGGAGCAGG CCCGCGAAAA GCTGTTGAAC 
GAGATGGGGC GCGAGTCCAC GCCATCTAAT AAAAATACCC CGGCTCATAT TTATGCCGGA 
AACGGTAATT TTGTGGGGGA TGGGATCCGC CAGGCGCTGA TGGCGCGTGC CGGATTTGAA 
AAAACCGAAC GTGATAATGT CTACAACGGG ATGACCCTGC GTGAATATGC CCGTATGTCA 
CTGACTGAAC GGGGTATTGG GGTTTCCAGT TATAACCCGA TGCAGATGGT CGGTGCGGCG 
TTCACACACA GTACGTCTGA CTTCGGTAAT ATTCTGCTGG ATGTTGCGAA CAAAGCCATT 
CTGCAGGGCT GGGAAGATGC CCCTGAAACC TATGAACAGT GGACGCGGAA AGGTCAGTTG 
TCTGATTTTA AAATTGCCCA TCGTGTGGGT ATGGGGGGCT TCAGTGCTCT GCGTCAGGTG 
CGTGAAGGGG CGGAATATAA ATACGTCACC ACCGGAGATA AACAGGCCAC TATTGCACTG 
GCGACCTATG GCGAGCTGTT CAGTATCACC CGTCAGGCCA TTATCAATGA TGATCTGAAT 
ATGCTGACCG ATGTCCCGAT GAAACTGGGC CGTGCGGCGA AATCCACTAT TGCCGATCTG 
GTTTATGCCA TTCTGACGTC TAACCCGAAA ATCTCCACAG ATAATGTAAG TCTGTTCGAT 
AAAGCGAAAC ATGCAAACGT ACTGGAGAGC GCTGCAATGG ACGTGGCATC GCTGGATAAA 
GCCCGCCAGT TGATGCGCGT TCAGAAAGAG GGGGAGCGTC ATCTGAATAT TCGTCCTGCG 
TTCGTACTGG TACCGACGGC GATGGAGTCT GTTGCTAACC AGGTCATTCG CTCCTCAAGT 
GTCAAGGGGG CTGACATTAA CGCCGGTATT ATTAACCCGG TGAAAGATTT TGCGACCGTT 
ATTGCAGAGC CTCGTCTTGA TGATAACAGC CAGACCACCT TCTACCTGGC TGCGTCAAAA 
GGCTCCGATA CGATTGAAGT GGCTTATCTC AACGGTGTGG ATACGCCATA TATTGATCAG 
ATGGAGGGCT TCAGTGTGGA TGGCGTGACA ACGAAAGTGC GTATTGACGC CGGTGTCGCG 
CCAGTTGATC ACCGCGGTCT GGTGAAATGT ACGGCGTAA

Protein sequence

MQAGHQSDAD IYIYDEIGFW GVTAKQFISD LNALGDITHI NLNINSPGGD VFEGIAIFNA 
LKTHGASITV YVDGVAASMA SVIAMVGKPV IMPENSFMMI HKPFGFTGGD AEDMRTYADL 
LDKVEAVLLP AYAQKTGKTT DEIAAMLADE TWMSGAECLA HGFADQVTPA VKAMACIQSK 
RTEEFKKMPE SIRNMITPPR NSAPRVQDDG PAASRTPVQA AAPVVDENSI RAQVLAEQKA 
RVNGINDLFA MFGGRYQTLQ AQCLADPECS LEQAREKLLN EMGRESTPSN KNTPAHIYAG 
NGNFVGDGIR QALMARAGFE KTERDNVYNG MTLREYARMS LTERGIGVSS YNPMQMVGAA 
FTHSTSDFGN ILLDVANKAI LQGWEDAPET YEQWTRKGQL SDFKIAHRVG MGGFSALRQV 
REGAEYKYVT TGDKQATIAL ATYGELFSIT RQAIINDDLN MLTDVPMKLG RAAKSTIADL 
VYAILTSNPK ISTDNVSLFD KAKHANVLES AAMDVASLDK ARQLMRVQKE GERHLNIRPA 
FVLVPTAMES VANQVIRSSS VKGADINAGI INPVKDFATV IAEPRLDDNS QTTFYLAASK 
GSDTIEVAYL NGVDTPYIDQ MEGFSVDGVT TKVRIDAGVA PVDHRGLVKC TA