Gene EcSMS35_4373 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4373
Symbol	hslU
ID	6146544
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	4459281
End bp	4460612
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	52%
IMG OID	641619194
Product	ATP-dependent protease ATP-binding subunit HslU
Protein accession	YP_001746318
Protein GI	170683012
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1220] ATP-dependent protease HslVU (ClpYQ), ATPase subunit
TIGRFAM ID	[TIGR00390] ATP-dependent protease HslVU, ATPase subunit

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	0.611238
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGAAA TGACCCCACG CGAAATCGTC AGCGAACTGG ATAAGCACAT CATCGGCCAG 
GACAACGCCA AGCGTTCTGT GGCGATTGCT CTGCGTAACC GCTGGCGTCG CATGCAGCTC 
AACGAAGAGC TGCGCCATGA AGTGACCCCG AAAAATATCC TGATGATCGG CCCGACCGGT 
GTCGGTAAAA CTGAAATCGC CCGTCGTCTG GCTAAGCTGG CGAATGCGCC GTTCATCAAA 
GTTGAAGCGA CCAAATTCAC CGAAGTGGGC TATGTCGGTA AGGAAGTGGA TTCTATTATT 
CGCGATCTGA CCGATGCCGC CGTGAAAATG GTACGCGTCC AGGCTATCGA GAAAAACCGT 
TATCGCGCTG AAGAACTGGC AGAAGAACGT ATTCTCGACG TGCTGATCCC ACCTGCTAAA 
AACAACTGGG GACAGACCGA ACAGCAGCAG GAACCGTCCG CTGCTCGTCA GGCATTCCGC 
AAAAAACTGC GTGAAGGCCA GCTTGATGAC AAAGAAATCG AGATCGATCT TGCCGCAGCA 
CCGATGGGCG TTGAAATTAT GGCTCCTCCG GGCATGGAAG AGATGACCAG CCAGCTGCAG 
TCCATGTTCC AGAACCTGGG CGGTCAGAAG CAAAAAGCGC GTAAGCTGAA AATCAAAGAC 
GCCATGAAGC TGCTGATTGA AGAAGAAGCG GCGAAACTGG TGAACCCGGA AGAGCTGAAG 
CAAGATGCTA TCGACGCTGT TGAGCAGCAC GGGATCGTGT TTATCGACGA AATCGACAAA 
ATCTGTAAGC GCGGCGAGTC TTCCGGTCCG GATGTTTCTC GTGAAGGCGT TCAGCGTGAC 
CTGCTGCCGC TGGTAGAAGG TTGCACTGTT TCCACCAAAC ACGGGATGGT CAAAACTGAC 
CACATTCTGT TTATCGCTTC TGGCGCGTTC CAGATTGCGA AACCGTCTGA CCTGATCCCG 
GAACTGCAAG GTCGTCTGCC AATCCGCGTT GAGCTGCAGG CACTGACCAC CAGCGACTTC 
GAGCGTATTC TGACCGAGCC GAATGCCTCT ATCACCGTGC AGTACAAAGC ATTGATGGCG 
ACTGAAGGCG TAAATATCGA GTTCACCGAC TCCGGTATTA AGCGGATCGC GGAAGCAGCA 
TGGCAGGTGA ACGAATCTAC CGAAAACATC GGTGCTCGTC GTTTACATAC TGTTCTGGAG 
CGTTTAATGG AAGAGATTTC CTACGACGCC AGCGATTTAA GCGGTCAAAC CATCACTATT 
GACGCAGATT ATGTGAGCAA ACATCTGGAT GCGTTGGTGG CAGATGAAGA TCTGAGCCGT 
TTTATCCTAT AA

Protein sequence

MSEMTPREIV SELDKHIIGQ DNAKRSVAIA LRNRWRRMQL NEELRHEVTP KNILMIGPTG 
VGKTEIARRL AKLANAPFIK VEATKFTEVG YVGKEVDSII RDLTDAAVKM VRVQAIEKNR 
YRAEELAEER ILDVLIPPAK NNWGQTEQQQ EPSAARQAFR KKLREGQLDD KEIEIDLAAA 
PMGVEIMAPP GMEEMTSQLQ SMFQNLGGQK QKARKLKIKD AMKLLIEEEA AKLVNPEELK 
QDAIDAVEQH GIVFIDEIDK ICKRGESSGP DVSREGVQRD LLPLVEGCTV STKHGMVKTD 
HILFIASGAF QIAKPSDLIP ELQGRLPIRV ELQALTTSDF ERILTEPNAS ITVQYKALMA 
TEGVNIEFTD SGIKRIAEAA WQVNESTENI GARRLHTVLE RLMEEISYDA SDLSGQTITI 
DADYVSKHLD ALVADEDLSR FIL