Gene RPB_0403 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_0403
Symbol	hslU
ID	3908841
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	447864
End bp	449165
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	66%
IMG OID	637882289
Product	ATP-dependent protease ATP-binding subunit HslU
Protein accession	YP_484025
Protein GI	86747529
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1220] ATP-dependent protease HslVU (ClpYQ), ATPase subunit
TIGRFAM ID	[TIGR00390] ATP-dependent protease HslVU, ATPase subunit

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.236378
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACT TCTCACCCCG CGAAATCGTT TCCGAACTCG ACCGCTTCAT CGTCGGCCAG 
GCCGACGCCA AGCGCGCGGT CGCCATCGCG CTGCGCAACC GCTGGCGGCG GCTGCAGCTC 
GAAGGCGCGC TGCGCGAAGA AGTGCTGCCG AAGAACATCC TGATGATCGG GCCGACCGGC 
GTCGGCAAGA CCGAGATCGC GCGCCGGCTG GCCAAGCTCG CCAACGCACC GTTCCTCAAA 
GTCGAGGCCA CCAAATTCAC CGAGGTCGGC TATGTCGGCC GCGACGTCGA GCAGATCATC 
CGCGATCTGG TCGAAGTGGC GATCGCGCAG GTGCGCGAGA AGAAGCGCAA GGACGTCCAG 
GCCCGCGCCC AGATCGCCGC CGAGGAACGC GTGCTCGATG CGCTGGTCGG CCCGGGATCG 
AGCCCGGCGA CGCGGGACTC GTTTCGCCGC AAGCTGCGGA CCGGCGAGCT CAACGACAAG 
GAAATCGAAA TCGAGACCCA GGCCGGCGGC GGCTCGCCGA TGTTCGAAAT TCCGGGCATG 
CCGGGCGGCC AGATCGGCGC GATTTCGATC GGCGACATCT TCGGCAAGAT GGGTGGCCGC 
ACCAAGACGC GCAGGCTCAC CGTCGTCGAT TCGCACGACA TCCTCGTCAA CGAGGAAGCC 
GACAAGCTGC TCGACAATGA CCAGCTGGTG CAGGAAGCCA TCAACGCCGT CGAGAACAAC 
GGCATCGTGT TTCTCGACGA GATCGACAAG ATCTGCGTGC GCGACGGCCG CAGCGGCGGC 
GAGGTCTCGC GCGAGGGCGT GCAGCGCGAT CTGCTGCCGC TGATCGAAGG CACCACGGTC 
GCCACCAAGC ACGGCGCGGT GAAGACCGAT CACATCCTGT TCATCGCCTC CGGCGCGTTC 
CACATCGCCA AGCCGTCCGA CCTGCTGCCG GAGCTGCAGG GCCGGCTGCC GATCCGGGTC 
GAGCTCAACG CACTCTCCCG CGACGACATG CGCCGGATTC TGACCGAGCC GGAAGCCTCG 
CTGATCAAGC AATATGTGGC GCTGCTGCAG ACCGAAGGCG TGACGCTGGA ATTCGGCGAC 
GACGCCATCG ACGCGCTCGC CGACGTCGCG GTCGCGGTCA ACTCCACCGT CGAGAACATC 
GGCGCGCGGC GGCTGCAGAC GGTGATGGAG CGCGTGCTCG ACGACATCTC CTTCGGCGCG 
CCGGACCGAG GCGGCGAGAC CATCCGGATC GACGCCGACT ACGTCCAGAA GAACGTCGGC 
GATCTGGCGA AGAACACGGA TTTGAGCCGG TTCATCTTGT AG

Protein sequence

MTDFSPREIV SELDRFIVGQ ADAKRAVAIA LRNRWRRLQL EGALREEVLP KNILMIGPTG 
VGKTEIARRL AKLANAPFLK VEATKFTEVG YVGRDVEQII RDLVEVAIAQ VREKKRKDVQ 
ARAQIAAEER VLDALVGPGS SPATRDSFRR KLRTGELNDK EIEIETQAGG GSPMFEIPGM 
PGGQIGAISI GDIFGKMGGR TKTRRLTVVD SHDILVNEEA DKLLDNDQLV QEAINAVENN 
GIVFLDEIDK ICVRDGRSGG EVSREGVQRD LLPLIEGTTV ATKHGAVKTD HILFIASGAF 
HIAKPSDLLP ELQGRLPIRV ELNALSRDDM RRILTEPEAS LIKQYVALLQ TEGVTLEFGD 
DAIDALADVA VAVNSTVENI GARRLQTVME RVLDDISFGA PDRGGETIRI DADYVQKNVG 
DLAKNTDLSR FIL