Gene ECH74115_5388 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5388
Symbol	hslU
ID	6971956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	5025021
End bp	5026352
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	52%
IMG OID	643389042
Product	ATP-dependent protease ATP-binding subunit HslU
Protein accession	YP_002273451
Protein GI	209395997
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1220] ATP-dependent protease HslVU (ClpYQ), ATPase subunit
TIGRFAM ID	[TIGR00390] ATP-dependent protease HslVU, ATPase subunit

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGAAA TGACCCCACG CGAAATCGTC AGCGAACTGG ATAAGCACAT CATCGGCCAG 
AACAACGCCA AGCGTTCCGT GGCGATTGCT CTGCGTAACC GCTGGCGTCG CATGCAGCTC 
AACGAAGAGC TGCGCCATGA AGTGACCCCG AAAAATATCC TGATGATCGG CCCGACCGGT 
GTCGGTAAAA CTGAAATCGC CCGTCGTCTG GCTAAGCTGG CGAATGCGCC GTTCATCAAA 
GTTGAAGCGA CCAAATTCAC CGAAGTGGGC TACGTCGGTA AGGAAGTGGA TTCTATTATT 
CGCGATCTGA CCGATGCCGC CGTGAAAATG GTACGCGTCC AGGCTATCGA GAAAAACCGT 
TATCGCGCTG AAGAACTGGC AGAAGAACGT ATTCTCGACG TGCTGATCCC ACCTGCTAAA 
AACAACTGGG GACAGACCGA ACAGCAGCAG GAACCGTCCG CTGCTCGTCA GGCATTCCGC 
AAAAAACTGC GTGAAGGCCA GCTTGATGAC AAAGAAATCG AGATCGATCT TGCCGCAGCA 
CCGATGGGCG TTGAAATTAT GGCTCCTCCA GGCATGGAAG AGATGACCAG CCAGCTGCAG 
TCCATGTTCC AGAACCTGGG CGGTCAGAAG CAAAAAGCGC GTAAGCTGAA AATCAAAGAC 
GCCATGAAGC TGCTGATTGA AGAAGAAGCG GCGAAACTGG TGAACCCGGA AGAGCTGAAG 
CAAGACGCTA TCGACGCTGT TGAGCAGCAC GGGATCGTGT TTATCGACGA AATCGACAAA 
ATCTGTAAGC GCGGCGAGTC TTCCGGTCCG GATGTTTCTC GTGAAGGCGT TCAGCGAGAC 
CTGCTGCCGC TGGTAGAAGG TTGCACCGTT TCCACCAAAC ACGGGATGGT CAAAACTGAC 
CACATTCTGT TTATCGCTTC TGGCGCGTTC CAGATTGCGA AACCGTCTGA CCTGATCCCG 
GAACTGCAAG GTCGACTGCC AATCCGCGTT GAACTGCAGG CACTGACCAC CAGCGACTTC 
GAGCGTATTC TGACCGAGCC GAATGCCTCT ATCACCGTGC AGTACAAAGC ACTGATGGCG 
ACTGAAGGCG TAAATATCGA GTTTACCGAC TCCGGTATTA AACGCATCGC GGAAGCGGCA 
TGGCAGGTGA ACGAATCTAC CGAAAACATC GGTGCTCGTC GTTTACACAC TGTTCTGGAG 
CGTTTAATGG AAGAGATTTC CTACGACGCC AGCGATTTAA GCGGTCAAAA TATCACTATT 
GACGCAGATT ATGTGAGCAA ACATCTGGAT GCGTTGGTGG CAGATGAAGA TCTGAGCCGT 
TTTATCCTAT AA

Protein sequence

MSEMTPREIV SELDKHIIGQ NNAKRSVAIA LRNRWRRMQL NEELRHEVTP KNILMIGPTG 
VGKTEIARRL AKLANAPFIK VEATKFTEVG YVGKEVDSII RDLTDAAVKM VRVQAIEKNR 
YRAEELAEER ILDVLIPPAK NNWGQTEQQQ EPSAARQAFR KKLREGQLDD KEIEIDLAAA 
PMGVEIMAPP GMEEMTSQLQ SMFQNLGGQK QKARKLKIKD AMKLLIEEEA AKLVNPEELK 
QDAIDAVEQH GIVFIDEIDK ICKRGESSGP DVSREGVQRD LLPLVEGCTV STKHGMVKTD 
HILFIASGAF QIAKPSDLIP ELQGRLPIRV ELQALTTSDF ERILTEPNAS ITVQYKALMA 
TEGVNIEFTD SGIKRIAEAA WQVNESTENI GARRLHTVLE RLMEEISYDA SDLSGQNITI 
DADYVSKHLD ALVADEDLSR FIL