Gene Acid345_0212 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0212
Symbol	hslU
ID	4071665
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	226406
End bp	227824
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	59%
IMG OID	637982213
Product	ATP-dependent protease ATP-binding subunit HslU
Protein accession	YP_589291
Protein GI	94967243
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1220] ATP-dependent protease HslVU (ClpYQ), ATPase subunit
TIGRFAM ID	[TIGR00390] ATP-dependent protease HslVU, ATPase subunit

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.571703
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCAATTT ATCTTCCCGC AACAACCGAT GATGAACAGG TAATGCTCGA CGAGCTGACG 
CCGCGCGAGA TCGTGGCGGA ACTCGACAAG TACGTAGTGG GCCAGCACGA AGCCAAGCGC 
GCGGTAGCGA TCGCGCTCCG CAATCGCATG CGCCGGCAGC GGCTGACGCC CGATCTCGCG 
GAAGAGATCA TTCCGAAGAA CATCATCATG ATCGGGCCCA CCGGCGTGGG CAAAACCGAG 
ATCGCACGAC GGTTGGCAAA GCTGGCGAAC TCGCCCTTCC TGAAGGTCGA GGCATCGAAG 
TTCACCGAGG TCGGCTACGT AGGTCGCGAC GTGGAATCGA TGATCCGAGA CCTGGTCGAG 
ATCGCGATTG ACATGATCCG CGAAGAGAAG CTCGACGATG TGGCCGACAA GGCCGAGATG 
AACGCCGAAG AGCGTCTGCT CGATTTGCTG CTTCCGAGTT CACCGCAGCC GGCTGCTGCG 
CACGAAGCGG GTGCCGGATT CACGCAAGGA CAGTTGGAGT TGCCGGGCGA CGGAGGCGGT 
TCCCGCACGC GGGAAAAATT GCGTCAGCAG CTGCGTGAAG GCAAGCTCGA CGAGCGCACC 
GTGGAACTCG ATGTCCGCGA GAAGAACTTC CCTGCCTTCG AGATCATCTC GAACCAGGGC 
GTGGAAGAGA TGGACATCAA CATGAAGGAC ATGTTGCCCA ACATCTTCGG CTCGCGCACC 
AAGAAGCGGA AGATGAAAGT CAACGAAGCC TTCGATTATC TGATCCAGGA AGAAGAGCAG 
CGACTCATCG ATATGGAGCA GGTGCAGCGC GTAGCGGTGG AACGCGTGGA GCAATCGGGC 
ATCATCTTCC TCGATGAGAT CGACAAGATC GCCGGCCGCG AAGGCGGCCA TGGGCCTGAT 
GTTTCGCGCG AGGGCGTGCA GCGCGACATC CTGCCGATCG TTGAAGGCAC CACCTGCAAC 
ACTCGCTACG GCATGGTGCG CACCGACCAC ATCCTGTTCA TCGCCGCGGG CGCGTTCCAC 
GTATCGAAGC CCAGCGATTT GATTCCGGAA CTGCAGGGGC GCTTCCCGAT CCGCGTGGAG 
TTGCAATCGC TGAGCGTTGC GGACTTCATC AAGATCCTGA CCGAGCCGAA GTCGTCGCTG 
GTGAAGCAGT ACACAGCGCT GCTGGAGACC GAAGGCGTGA AGCTGGAGTT CACACGCGAT 
GCGCTGGACG AAGTCGCGAA CTTCGCGGCG ATTGTGAATG AGGGCACCGA GAATATCGGT 
GCACGACGTT TGCACACGAT CATGGAAAAA GTTCTGGACG AGATCAGCTT CTCCGCGCCG 
GACCTGGAAA ACAAGAATGT AACCGTGGAC GCGGAGTACG TGCGCAATGC TCTGGTTCAC 
ATCGTGAAGA ACCAGGATTT GTCGCGGTAC ATTCTGTAA

Protein sequence

MAIYLPATTD DEQVMLDELT PREIVAELDK YVVGQHEAKR AVAIALRNRM RRQRLTPDLA 
EEIIPKNIIM IGPTGVGKTE IARRLAKLAN SPFLKVEASK FTEVGYVGRD VESMIRDLVE 
IAIDMIREEK LDDVADKAEM NAEERLLDLL LPSSPQPAAA HEAGAGFTQG QLELPGDGGG 
SRTREKLRQQ LREGKLDERT VELDVREKNF PAFEIISNQG VEEMDINMKD MLPNIFGSRT 
KKRKMKVNEA FDYLIQEEEQ RLIDMEQVQR VAVERVEQSG IIFLDEIDKI AGREGGHGPD 
VSREGVQRDI LPIVEGTTCN TRYGMVRTDH ILFIAAGAFH VSKPSDLIPE LQGRFPIRVE 
LQSLSVADFI KILTEPKSSL VKQYTALLET EGVKLEFTRD ALDEVANFAA IVNEGTENIG 
ARRLHTIMEK VLDEISFSAP DLENKNVTVD AEYVRNALVH IVKNQDLSRY IL