Gene EcolC_4087 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_4087
Symbol	hslU
ID	6065640
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	4513553
End bp	4514884
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	53%
IMG OID	641603509
Product	ATP-dependent protease ATP-binding subunit HslU
Protein accession	YP_001727012
Protein GI	170022058
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1220] ATP-dependent protease HslVU (ClpYQ), ATPase subunit
TIGRFAM ID	[TIGR00390] ATP-dependent protease HslVU, ATPase subunit

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGAAA TGACCCCACG CGAAATCGTC AGCGAACTGG ATAAGCACAT CATCGGCCAG 
GACAACGCCA AGCGTTCTGT GGCGATTGCT CTGCGTAACC GCTGGCGTCG CATGCAGCTC 
AACGAAGAGC TGCGCCATGA AGTGACCCCG AAAAATATCC TGATGATCGG CCCGACCGGT 
GTCGGTAAAA CTGAAATCGC CCGTCGTCTG GCTAAGCTGG CGAATGCGCC GTTCATCAAA 
GTTGAAGCGA CCAAATTCAC CGAAGTGGGC TACGTCGGTA AGGAAGTGGA TTCTATTATT 
CGCGATCTGA CCGATGCCGC CGTGAAAATG GTACGCGTCC AGGCTATCGA GAAAAACCGT 
TATCGCGCTG AAGAACTGGC AGAAGAACGT ATTCTCGACG TGCTGATCCC ACCTGCTAAA 
AACAACTGGG GACAGACCGA ACAGCAGCAG GAACCGTCCG CTGCTCGTCA GGCATTCCGC 
AAAAAACTGC GTGAAGGCCA GCTTGATGAC AAAGAAATCG AGATCGATCT TGCCGCAGCA 
CCGATGGGCG TTGAAATTAT GGCTCCTCCG GGCATGGAAG AGATGACCAG CCAGCTGCAG 
TCCATGTTCC AGAACCTGGG CGGCCAGAAG CAAAAAGCGC GTAAGCTGAA AATCAAAGAC 
GCCATGAAGC TGCTGATTGA AGAAGAAGCG GCGAAACTGG TGAACCCGGA AGAGCTGAAG 
CAAGACGCTA TCGACGCTGT TGAGCAGCAC GGGATCGTGT TTATCGACGA AATCGACAAA 
ATCTGTAAGC GCGGCGAGTC TTCCGGTCCG GATGTTTCTC GTGAAGGCGT TCAGCGTGAC 
CTGCTGCCGC TGGTAGAAGG TTGCACCGTT TCCACCAAAC ACGGGATGGT CAAAACTGAC 
CACATTCTGT TTATCGCTTC TGGCGCGTTC CAGATTGCGA AACCGTCTGA CCTGATCCCG 
GAACTGCAAG GTCGTCTGCC AATCCGCGTT GAACTGCAGG CGCTGACCAC CAGCGACTTC 
GAGCGTATTC TGACCGAGCC GAATGCCTCT ATCACCGTGC AGTACAAAGC ACTGATGGCG 
ACTGAAGGCG TAAATATCGA GTTTACCGAC TCCGGTATTA AACGCATCGC GGAAGCGGCA 
TGGCAGGTGA ACGAATCTAC CGAAAACATC GGTGCTCGTC GTTTACACAC TGTTCTGGAG 
CGTTTAATGG AAGAGATTTC CTACGACGCC AGCGATTTAA GCGGTCAAAA TATCACTATT 
GACGCAGATT ATGTGAGCAA ACATCTGGAT GCGTTGGTGG CAGATGAAGA TCTGAGCCGT 
TTTATCCTAT AA

Protein sequence

MSEMTPREIV SELDKHIIGQ DNAKRSVAIA LRNRWRRMQL NEELRHEVTP KNILMIGPTG 
VGKTEIARRL AKLANAPFIK VEATKFTEVG YVGKEVDSII RDLTDAAVKM VRVQAIEKNR 
YRAEELAEER ILDVLIPPAK NNWGQTEQQQ EPSAARQAFR KKLREGQLDD KEIEIDLAAA 
PMGVEIMAPP GMEEMTSQLQ SMFQNLGGQK QKARKLKIKD AMKLLIEEEA AKLVNPEELK 
QDAIDAVEQH GIVFIDEIDK ICKRGESSGP DVSREGVQRD LLPLVEGCTV STKHGMVKTD 
HILFIASGAF QIAKPSDLIP ELQGRLPIRV ELQALTTSDF ERILTEPNAS ITVQYKALMA 
TEGVNIEFTD SGIKRIAEAA WQVNESTENI GARRLHTVLE RLMEEISYDA SDLSGQNITI 
DADYVSKHLD ALVADEDLSR FIL