Gene Clim_1118 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1118
Symbol	hslU
ID	6355760
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	1219015
End bp	1220487
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	55%
IMG OID	642668735
Product	ATP-dependent protease ATP-binding subunit HslU
Protein accession	YP_001943166
Protein GI	189346637
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1220] ATP-dependent protease HslVU (ClpYQ), ATPase subunit
TIGRFAM ID	[TIGR00390] ATP-dependent protease HslVU, ATPase subunit

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCATTA CCAGCGACAC TGAAGCTGCT GCCAGGACAG AAGGAAGAAG TGCTATTGCC 
GCACATAATC TTACACCGAA CCAGATTGTC GAACTTCTCG ATAAATATAT CATCGGGCAG 
AAAGACGCCA AGAAATCGGT AGCCATCGCT CTGCGCAACC GGTTGCGCCG TCAGCATGTA 
GGCGACGATC TTCGCGAGGA GATCATGCCG AACAACATCA TCATGATAGG GCCTACCGGC 
GTGGGTAAAA CCGAAATAGC CCGGAGGCTT GCCAAGCTTG CCAAAGCCCC GTTTGTAAAG 
GTAGAGGCTT CAAAATTCAC CGAAGTCGGC TATGTGGGGC GCGATGTCGA ATCCATGATC 
CGCGACCTGG TCGATCAGTC GGTAGCCATG GTGCGCAGCG AGAAATCCGA AGAGGTAAAA 
GAAAAAGCCG CTCTTCTTGT CGAGGAGCGT CTTCTCGATA TACTCCTTCC TCCGGCTCCG 
CCGTCACGAT CGCATGAGGA TCAGGACGAC GACCTGGACG AAAACCGGAA TGCCATGGCT 
CCGGCGGACG AGAACGATAT TTCACAGGAG GTTAACCGCC GCAGCCGGGA AAAGATGCTT 
GAACGGCTTC GCAAGGGAAA GCTCGAGGAC CGTCAGATCG AAATGGATAC GGCAAGCGAG 
AACCCAGGGG GGATGATGCA AATATTCGGT CCTCTCGGCC AGATGGAGGA GATCGGAAGC 
ATCATGCAGG ATCTCATGAG CGGTCTGCCG CGCAAGCGCA AAAAACGTCG GGTAACGATA 
GCAGAAGCCC GCCGGATACT CGAACAGGAG GAGGTGCAGA AGCTTATCGA TATGGACGCC 
GTGGTCAAGG ATGCCATCAA CAAGGTCGAA CAGTCCGGCA TTGTGTTCAT CGACGAGATC 
GACAAGATAG CCGCTCCGTC GACTGGTTCG GGAGGCGGCA AAGGCCCCGA CGTCAGCCGT 
GAAGGGGTGC AGCGCGACCT TCTGCCTATT GTCGAAGGAT CCAACGTCGC CACCAAATAC 
GGCATCGTCA AAACCGACCA TGTGCTTTTC ATCGCATCAG GCGCTTTTCA CGTCTCCAAG 
CCCTCCGACC TCATTCCCGA ACTGCAGGGC CGCTTTCCCA TCAGGGTCGA ACTCAAAAGC 
CTTACCGAGG AGGATTTCTA CAAGATTCTC ACCCAGCCGA AGAACGCGCT CATCAAGCAG 
TACAAGGCGC TGATCAGCAC CGAGGGGGTC GATCTGGACT TTACCGACGG AGCGATACTT 
GAGATCGCCA GAATCGCGGC CAAGGTCAAC GAAAGCGTTG AGAATATCGG AGCACGCCGG 
CTGCACACCA TCATGACCAA TCTGCTCGAA GAGCTGATGT TCAACATTCC CGAAAGCGTG 
ACGGAAGAAA AGGTAGTGAT TGACGAAGCC ATGGTGCAGG ATAAGCTTTC CGCGGTCTCA 
TCGGATCGTG ATCTGAGCCA GTATATTCTC TAA

Protein sequence

MTITSDTEAA ARTEGRSAIA AHNLTPNQIV ELLDKYIIGQ KDAKKSVAIA LRNRLRRQHV 
GDDLREEIMP NNIIMIGPTG VGKTEIARRL AKLAKAPFVK VEASKFTEVG YVGRDVESMI 
RDLVDQSVAM VRSEKSEEVK EKAALLVEER LLDILLPPAP PSRSHEDQDD DLDENRNAMA 
PADENDISQE VNRRSREKML ERLRKGKLED RQIEMDTASE NPGGMMQIFG PLGQMEEIGS 
IMQDLMSGLP RKRKKRRVTI AEARRILEQE EVQKLIDMDA VVKDAINKVE QSGIVFIDEI 
DKIAAPSTGS GGGKGPDVSR EGVQRDLLPI VEGSNVATKY GIVKTDHVLF IASGAFHVSK 
PSDLIPELQG RFPIRVELKS LTEEDFYKIL TQPKNALIKQ YKALISTEGV DLDFTDGAIL 
EIARIAAKVN ESVENIGARR LHTIMTNLLE ELMFNIPESV TEEKVVIDEA MVQDKLSAVS 
SDRDLSQYIL