Gene Sala_1595 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1595
Symbol	hslU
ID	4083032
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	1670905
End bp	1672206
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	66%
IMG OID	638009964
Product	ATP-dependent protease ATP-binding subunit HslU
Protein accession	YP_616641
Protein GI	103487080
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1220] ATP-dependent protease HslVU (ClpYQ), ATPase subunit
TIGRFAM ID	[TIGR00390] ATP-dependent protease HslVU, ATPase subunit

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.472132
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.884744
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAAAG ATTTGACCCC GAAGGCGATC GTCGCCGCAC TGGACACGCA TATCATCGGC 
CAGGATGCGG CGAAGCGCGC GGTCGCGGTG GCGCTGCGCA ACCGCTGGCG CCGCCAGCAG 
CTGCCCGCCG AGCTGCGCGA CGAGGTGACG CCGAAGAATA TCCTGATGAT CGGCCCCACC 
GGCTGCGGCA AGACCGAGAT TTCGCGCCGC CTGGCCAAGC TCGCCGATGC GCCCTTCATC 
AAGGTCGAGG CGACCAAGTT CACCGAGGTC GGCTATGTCG GCCGCGACGT CGAGCAGATC 
GCGCGCGACC TCGTCGAAGA GGCGGTGCGG CTGGAAAAGG ACCGCCGCCG CGACGCCGTG 
CGCGCCGCCG CCGAAGAGGC CGCGATGGAA CGGCTGCTCG ACGCGCTCAC CGGCAAGGGC 
GCGAGCGAGG CGACGCGCCA GAGCTTTCGC CAACGCATCC GCGAAGGCCA TCTCGACGAC 
AGCGAGGTGG AGATCGAGGT CGCCGACGCG CCCGGCATGA GTTTCGAACT GCCCGGCCAG 
CCGGGGCAGA TGAGCATGAT CAACCTGTCC GACATGCTCG GCAAGGCGAT GGGCGGCCTG 
CCCAGGAAAC GCCGCAAGAT GAAGGTGATC GACGCCGCGA CGCGGTTGAT CGAGGAGGAG 
CAGGACAAAA GGCTCGACCA GGACGATGTC GCCCGCGTCG CGCTCGCCGA TGCCGAGGCC 
AACGGCATCG TCTTCCTCGA CGAGATCGAC AAGATCGCGG TCAGCGACGT GCGCGGCGGA 
TCGGTCAGTC GCGAGGGGGT GCAGCGCGAC CTCTTGCCGC TCATCGAGGG CACGACCGTC 
GCGACCAAAT ATGGCCCGAT GAAGACCGAT CATATCCTCT TCATCGCGTC GGGCGCCTTT 
CACGTCGCCA AGCCCAGCGA CCTGCTCCCC GAACTCCAGG GCCGCCTGCC GATCCGCGTC 
GAACTCGGTG CGCTCACCGA GGAGGATTTC GTCCGCATCC TGAGCGAGAC GAAGGCGGGG 
CTGCCCGAAC AATATGTCGC GCTGCTCGGC ACCGAGGGCG TGACGCTGAA CTTCGCCCCC 
GACGCGATCG CGCGCGTCGC GAAACTCGCC GCCGAAGTGA ACGAAAAGGT CGAGAATATC 
GGCGCGCGCC GACTTCAGAC GATCATGGAA CGGCTGGTCG AGGAAATCAG CTTCACCGCC 
GAGGATGCTC CCGGCGCGAC GATCGACATC GACGCCGCCT ATGTCGACCG CCAGCTTGCC 
GATGTCGTGG GCGACACCGA TCTCAGCAAA TATGTGCTTT AG

Protein sequence

MNKDLTPKAI VAALDTHIIG QDAAKRAVAV ALRNRWRRQQ LPAELRDEVT PKNILMIGPT 
GCGKTEISRR LAKLADAPFI KVEATKFTEV GYVGRDVEQI ARDLVEEAVR LEKDRRRDAV 
RAAAEEAAME RLLDALTGKG ASEATRQSFR QRIREGHLDD SEVEIEVADA PGMSFELPGQ 
PGQMSMINLS DMLGKAMGGL PRKRRKMKVI DAATRLIEEE QDKRLDQDDV ARVALADAEA 
NGIVFLDEID KIAVSDVRGG SVSREGVQRD LLPLIEGTTV ATKYGPMKTD HILFIASGAF 
HVAKPSDLLP ELQGRLPIRV ELGALTEEDF VRILSETKAG LPEQYVALLG TEGVTLNFAP 
DAIARVAKLA AEVNEKVENI GARRLQTIME RLVEEISFTA EDAPGATIDI DAAYVDRQLA 
DVVGDTDLSK YVL