Gene EcHS_A4163 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4163
Symbol	hslU
ID	5595025
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	4148425
End bp	4149756
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	53%
IMG OID	640923265
Product	ATP-dependent protease ATP-binding subunit HslU
Protein accession	YP_001460724
Protein GI	157163406
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1220] ATP-dependent protease HslVU (ClpYQ), ATPase subunit
TIGRFAM ID	[TIGR00390] ATP-dependent protease HslVU, ATPase subunit

Plasmid Coverage information

Num covering plasmid clones	66
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGAAA TGACCCCACG CGAAATCGTC AGCGAACTGG ATAAGCACAT CATCGGCCAG 
GACAACGCCA AGCGTTCTGT GGCGATTGCT CTGCGTAACC GCTGGCGTCG CATGCAGCTC 
AACGAAGAGC TGCGCCATGA AGTGACCCCG AAAAATATCC TGATGATCGG CCCGACCGGT 
GTCGGTAAAA CTGAAATCGC CCGTCGTCTG GCTAAGCTGG CGAATGCGCC GTTCATCAAA 
GTTGAAGCGA CCAAATTCAC CGAAGTGGGC TACGTCGGTA AGGAAGTGGA TTCTATTATT 
CGCGATCTGA CCGATGCCGC CGTGAAAATG GTACGCGTCC AGGCTATCGA GAAAAACCGT 
TATCGCGCTG AAGAACTGGC AGAAGAACGT ATTCTCGACG TGCTGATCCC ACCTGCTAAA 
AACAACTGGG GACAGACCGA ACAGCAGCAG GAACCGTCCG CTGCTCGTCA GGCATTCCGC 
AAAAAACTGC GTGAAGGCCA GCTTGATGAC AAAGAAATCG AGATCGATCT TGCCGCAGCA 
CCGATGGGCG TTGAAATTAT GGCTCCTCCG GGCATGGAAG AGATGACCAG CCAGCTGCAG 
TCCATGTTCC AGAACCTGGG CGGCCAGAAG CAAAAAGCGC GTAAGCTGAA AATCAAAGAC 
GCCATGAAGC TGCTGATTGA AGAAGAAGCG GCGAAACTGG TGAACCCGGA AGAGCTGAAG 
CAAGACGCTA TCGACGCTGT TGAGCAGCAC GGGATCGTGT TTATCGACGA AATCGACAAA 
ATCTGTAAGC GCGGCGAGTC TTCCGGTCCG GATGTTTCTC GTGAAGGCGT TCAGCGTGAC 
CTGCTGCCGC TGGTAGAAGG TTGCACCGTT TCCACCAAAC ACGGGATGGT CAAAACTGAC 
CACATTCTGT TTATCGCTTC TGGCGCGTTC CAGATTGCGA AACCGTCTGA CCTGATCCCG 
GAACTGCAAG GTCGTCTGCC AATCCGCGTT GAACTGCAGG CGCTGACCAC CAGCGACTTC 
GAGCGTATTC TGACCGAGCC GAATGCCTCT ATCACCGTGC AGTACAAAGC ACTGATGGCG 
ACTGAAGGCG TAAATATCGA GTTTACCGAC TCCGGTATTA AACGCATCGC GGAAGCGGCA 
TGGCAGGTGA ACGAATCTAC CGAAAACATC GGTGCTCGTC GTTTACACAC TGTTCTGGAG 
CGTTTAATGG AAGAGATTTC CTACGACGCC AGCGATTTAA GCGGTCAAAA TATCACTATT 
GACGCAGATT ATGTGAGCAA ACATCTGGAT GCGTTGGTGG CAGATGAAGA TCTGAGCCGT 
TTTATCCTAT AA

Protein sequence

MSEMTPREIV SELDKHIIGQ DNAKRSVAIA LRNRWRRMQL NEELRHEVTP KNILMIGPTG 
VGKTEIARRL AKLANAPFIK VEATKFTEVG YVGKEVDSII RDLTDAAVKM VRVQAIEKNR 
YRAEELAEER ILDVLIPPAK NNWGQTEQQQ EPSAARQAFR KKLREGQLDD KEIEIDLAAA 
PMGVEIMAPP GMEEMTSQLQ SMFQNLGGQK QKARKLKIKD AMKLLIEEEA AKLVNPEELK 
QDAIDAVEQH GIVFIDEIDK ICKRGESSGP DVSREGVQRD LLPLVEGCTV STKHGMVKTD 
HILFIASGAF QIAKPSDLIP ELQGRLPIRV ELQALTTSDF ERILTEPNAS ITVQYKALMA 
TEGVNIEFTD SGIKRIAEAA WQVNESTENI GARRLHTVLE RLMEEISYDA SDLSGQNITI 
DADYVSKHLD ALVADEDLSR FIL