Gene TM1040_2851 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2851
Symbol	hslU
ID	4076385
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	3021606
End bp	3022916
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	57%
IMG OID	638008180
Product	ATP-dependent protease ATP-binding subunit HslU
Protein accession	YP_614845
Protein GI	99082691
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1220] ATP-dependent protease HslVU (ClpYQ), ATPase subunit
TIGRFAM ID	[TIGR00390] ATP-dependent protease HslVU, ATPase subunit

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.192992
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.735765
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGATC TGACCCCCCG CGAAATCGTT TCTGAACTCG ACCGGTTCAT CATTGGCCAA 
AAGGATGCCA AACGCGCTGT CGCTGTAGCG TTGCGCAATC GCTGGCGCCG CAAACAGCTA 
CCGGATGACC TGCGCGACGA AGTGCATCCA AAGAACATCC TGATGATCGG CCCCACTGGC 
GTCGGCAAGA CCGAAATTTC GCGCCGCTTG GCGAAGCTGG CGCGCGCGCC TTTCATCAAG 
GTCGAAGCTA CCAAATTCAC CGAGGTTGGC TATGTCGGCC GCGACGTGGA ACAAATCGTG 
CGTGATCTTG TGGATACCGC AATCGTGCAA ACCCGCGAGC ACATGCGAGA GGACGTCAAA 
GCCAAGGCGC ATAAAGCCGC CGAGGACCGT GTGCTCGAAG CGATCGCCGG AACCGATGCC 
CGCGAGAGCA CGCTCGAGAT GTTCCGCAAA AAGCTCAAGG CAGGTGAGCT TGATGACACG 
GTGATCGAGT TGGACATCGC CGATACCTCC AACCCCATGG GCGGTATGTT TGAAATTCCG 
GGTCAGCCAG GTGCAAACAT GGGGATGATG AACCTCGGTG ATCTCTTCGG AAAAGCCATG 
GGCGGGCGTA CCACACGCAA AAAGCTCACC GTTGCAGAGA GCTATGACGT GTTGATCGGG 
GAAGAAGCGG ACAAGCTTCT GGATGATGAA ACCGTAAACA AGGCTGCATT GGAAGCAGTA 
GAGCAGAACG GGATCGTGTT CCTTGATGAG ATCGACAAGG TCTGCGCCCG TTCCGATGCG 
CGTGGTGGCG ACGTCAGCCG TGAGGGCGTG CAGCGGGACT TGCTGCCGCT GATCGAAGGC 
ACCACTGTCA GCACCAAACA TGGCCCAGTC AAAACCGACC ATATCCTGTT CATAGCGTCC 
GGTGCGTTCC ACATCGCCAA GCCTTCTGAT CTCCTGCCCG AGCTGCAAGG ACGTTTGCCG 
ATCCGCGTAA ACCTGCGCGC CCTCAGTGAA GAGGATTTTG TGCGCATCCT GACCGAAACC 
GACAATGCGC TGACACGCCA GTACGAGGCG CTCTTGGGCA CAGAAAAAGT CAAAGTGACC 
TTCACCAAGG ACGGGATCCA CGCCCTTGCG CAGATTGCCG CCGAAGTGAA CCACACGGTG 
GAGAACATCG GCGCGCGGCG TCTCTACACG GTAATGGAGC GGGTCTTTGA GGAGATGTCC 
TTTGCTGCGC CGGATCGATC CGGTGAAGAG ATCATCGTAG ATGAGCCCTT TGTGACCAAG 
AATTTGGGCG AATTGACCAA ATCCACCGAT CTCAGCCGCT ACGTGCTCTG A

Protein sequence

MTDLTPREIV SELDRFIIGQ KDAKRAVAVA LRNRWRRKQL PDDLRDEVHP KNILMIGPTG 
VGKTEISRRL AKLARAPFIK VEATKFTEVG YVGRDVEQIV RDLVDTAIVQ TREHMREDVK 
AKAHKAAEDR VLEAIAGTDA RESTLEMFRK KLKAGELDDT VIELDIADTS NPMGGMFEIP 
GQPGANMGMM NLGDLFGKAM GGRTTRKKLT VAESYDVLIG EEADKLLDDE TVNKAALEAV 
EQNGIVFLDE IDKVCARSDA RGGDVSREGV QRDLLPLIEG TTVSTKHGPV KTDHILFIAS 
GAFHIAKPSD LLPELQGRLP IRVNLRALSE EDFVRILTET DNALTRQYEA LLGTEKVKVT 
FTKDGIHALA QIAAEVNHTV ENIGARRLYT VMERVFEEMS FAAPDRSGEE IIVDEPFVTK 
NLGELTKSTD LSRYVL