Gene Tmz1t_0789 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_0789
Symbol	hslU
ID	7084181
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	+
Start bp	872230
End bp	873567
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	67%
IMG OID	643697813
Product	ATP-dependent protease ATP-binding subunit HslU
Protein accession	YP_002354454
Protein GI	217969220
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1220] ATP-dependent protease HslVU (ClpYQ), ATPase subunit
TIGRFAM ID	[TIGR00390] ATP-dependent protease HslVU, ATPase subunit

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.312061
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCAGA TGACCCCGCC GGAGATCGTC TCCGAACTCG ACAAGCACAT CGTCGGCCAG 
GACAAGGCCA AGAAGGCCGT GGCGATCGCG CTGCGCAACC GCTGGCGGCG CGCTCAGGTG 
GAAGAGCCGC TGCGCAGCGA GATCACCCCC AAGAACATCC TCATGATCGG CCCCACCGGC 
GTCGGCAAGA CCGAGATCGC GCGCCGCCTG GCGCGCCTGG CCAACGCGCC CTTCATCAAG 
ATCGAGGCGA CCAAGTTCAC CGAGGTCGGC TATGTCGGCC GCGACGTCGA CACCATCATC 
CGCGACCTCA TGGAGATCGC GGTCAAGGAC GGGCGCGAGC GTGCGATGAA GTCGGTGCGC 
GACCGCGCGC TGGATGCCGC CGAGGACCGC GTGCTCGACG CCCTGCTGCC GCCGGCGCGC 
CCGGTCGGCT TCAACGCCGA GCCCGAGCCG GCGCAGGATT CGTCCACCCG GCAGAAATTC 
CGCAAGAAGC TGCGCGAGGG GGAACTCGAC GACAAGGAGA TCGAGATCGA GGTCGCCGCG 
CCCTCGATGC AGGCCGAGAT CTTCGCCCCG CCGGGTATGG AGGAACTCAC CCAGCAGATA 
CAGGGCATGT TCCAGAACCT CGGCGGCGGC AAGAAGAAGC AGCGCAAGCT GCAGATCCGC 
GAGGCCATGA AGCTGCTCGC CGACGAGGAG GCCGCGCGCC TGATCAACGA CGAGGAGGTC 
AAGCTCGAGG CCGTGCGCGC GGTCGAGCAG AACGGCATCG TGTTCCTCGA CGAGGTGGAC 
AAGATCGCCG CGCGCAGCGA CGTGCAGGGC GCAGATGTCT CCCGTCAGGG CGTGCAGCGC 
GACCTGCTGC CGCTGGTCGA GGGCACGACG ATCTCCACCA AGTACGGCAT GATCAAGACC 
GATCACATCC TGTTCATCGC CAGCGGCGCC TTCCACCTGT CCAAGCCCTC GGATCTGATC 
CCCGAGCTGC AGGGGCGTTT CCCGATCCGC GTCGAGCTGG AGTCGCTGTC TGTGGAGGAC 
TTCGCCCGCA TCCTCACCAG CACCGACGCC TGCCTCACGC GCCAGTACGA GGCGCTGCTC 
GCCACCGACG GGGTGAAGCT GGAGTTCGCC GACGACGGCA TCCGCCGCCT GGCCGAGATC 
GCCTACCAGG TGAACGAGAA GACCGAGAAC ATCGGCGCGC GCCGGCTGTA CACCGTCATG 
GAGAAGCTGC TCGAAGAGGT TTCCTTCGAG GCCGGGCGCA GCAGTGCGGA GCAGACCGTG 
GTAGTCGACG CCGCCTATGT CGACAGCCGG CTCGTCATGC TCGCCCAGCG CGAGGATCTG 
GCGCGTTACG TGCTTTGA

Protein sequence

MTQMTPPEIV SELDKHIVGQ DKAKKAVAIA LRNRWRRAQV EEPLRSEITP KNILMIGPTG 
VGKTEIARRL ARLANAPFIK IEATKFTEVG YVGRDVDTII RDLMEIAVKD GRERAMKSVR 
DRALDAAEDR VLDALLPPAR PVGFNAEPEP AQDSSTRQKF RKKLREGELD DKEIEIEVAA 
PSMQAEIFAP PGMEELTQQI QGMFQNLGGG KKKQRKLQIR EAMKLLADEE AARLINDEEV 
KLEAVRAVEQ NGIVFLDEVD KIAARSDVQG ADVSRQGVQR DLLPLVEGTT ISTKYGMIKT 
DHILFIASGA FHLSKPSDLI PELQGRFPIR VELESLSVED FARILTSTDA CLTRQYEALL 
ATDGVKLEFA DDGIRRLAEI AYQVNEKTEN IGARRLYTVM EKLLEEVSFE AGRSSAEQTV 
VVDAAYVDSR LVMLAQREDL ARYVL