Gene Mpe_A3390 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A3390
Symbol	hslU
ID	4786377
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	3603593
End bp	3604939
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	70%
IMG OID	640091966
Product	ATP-dependent protease ATP-binding subunit HslU
Protein accession	YP_001022578
Protein GI	124268574
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1220] ATP-dependent protease HslVU (ClpYQ), ATPase subunit
TIGRFAM ID	[TIGR00390] ATP-dependent protease HslVU, ATPase subunit

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0502353
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCCGC AGGAGATCGT GTCCGAGCTG GACCGCCACA TCGTCGGCCA GCAGGACGCC 
AAGCGCGCCG TCGCGATCGC GCTGCGCAAC CGCTGGCGCC GCCAGCAGGT GGACGACAGG 
CTGCGCCCGG AGATCACGCC GAAGAACATC CTGATGATCG GGCCCACTGG CGTCGGCAAG 
ACCGAGATCG CGCGCCGCCT CGCGAAGCTG GCCGACGCGC CCTTCATCAA GGTGGAGGCC 
ACCAAGTTCA CCGAGGTCGG CTATGTCGGC AAGGACGTCG ATTCGATCAT CCGCGACCTG 
GTCGACCTGG CCGTCAAGCA GACGCGCGAG GCCGCGATCC GGGCCCATCG CGTCCGCGCC 
GAGGATGCCG CCGAGGAACG CATCCTCGAC GTGCTGCTGC CGCCGCCCGC CCATGCCGGC 
GCCGGCTTCG GGCTGAGCAC CAGCTCGCCG GCCCCCGCCC CGGCCGACAG CACGGCGCGC 
CAGACCTTCC GCAAGCGCCT GCGCGAGGGC ACGCTCGACG ACAAGGAGAT CGAGCTCGAA 
CTCGCCGAAC CGCGCGCTGC CGTCGAACTG CTGGGCCCGC CCGGCATGGA AGACATGGCC 
GAGCAACTCA AGGGCATGTT CGCCAGCCTG GGCCAGACGC GGCGCAAGAC CCGCAAGCTC 
AAGATCGCCG AGGCGTTGAA GCTGCTGGTC GACGAGGAGG CGGCCAAGCT GGTCAACGAG 
GACGAGATCA AGACGCAGGC GCTGGCCAGC GCCGAGCAGA ACGGCATCGT CTTCATCGAC 
GAGATCGACA AGGTCACGTC GCGCGGCGAC GGCGCCAGCG GCGCCGAGGT CTCGCGCCAG 
GGCGTGCAGC GCGACCTGCT GCCGCTGGTG GAGGGCACGA CGGTCAGCAC CAAGCACGGC 
ACTGTCAAGA CCGATCACAT CCTGTTCATC GCCTCGGGCG CCTTCCACCT GGCGCGCCCG 
AGCGACCTGA TCCCGGAGCT GCAGGGCCGC TTCCCGATCC GGGTGGAGCT GGGCTCGCTG 
CGGGTCGAGG ACTTCGAGGC GATCCTGACC CAGACCCACG CCAGCCTGGT ACGCCAGTAC 
CAGGCACTGC TGGACACCGA GGGCGTCCGG CTCGACTTCC GGCCCGAGGG TGTGCGCCGG 
CTGGCGCAGA TTGCGTTCGA CGTCAACGAG CGCACCGAGA ACATCGGCGC GCGCCGGCTG 
TCGACGGTGA TGGAGCGCCT GCTCGACGAG GTGAGCTTCG ATGCGCCGAA CCTGGGCGGC 
CAGACGATCG CGATCGACGC CGCCTACGTG GATCGCAAGC TCGGGGCGCT GGCGGTCGAC 
GAGGATCTGT CCCGCTTCAT TCTCTGA

Protein sequence

MTPQEIVSEL DRHIVGQQDA KRAVAIALRN RWRRQQVDDR LRPEITPKNI LMIGPTGVGK 
TEIARRLAKL ADAPFIKVEA TKFTEVGYVG KDVDSIIRDL VDLAVKQTRE AAIRAHRVRA 
EDAAEERILD VLLPPPAHAG AGFGLSTSSP APAPADSTAR QTFRKRLREG TLDDKEIELE 
LAEPRAAVEL LGPPGMEDMA EQLKGMFASL GQTRRKTRKL KIAEALKLLV DEEAAKLVNE 
DEIKTQALAS AEQNGIVFID EIDKVTSRGD GASGAEVSRQ GVQRDLLPLV EGTTVSTKHG 
TVKTDHILFI ASGAFHLARP SDLIPELQGR FPIRVELGSL RVEDFEAILT QTHASLVRQY 
QALLDTEGVR LDFRPEGVRR LAQIAFDVNE RTENIGARRL STVMERLLDE VSFDAPNLGG 
QTIAIDAAYV DRKLGALAVD EDLSRFIL