Gene Acid345_1559 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1559
Symbol	clpX
ID	4068668
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	1907332
End bp	1908603
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	57%
IMG OID	637983568
Product	ATP-dependent protease ATP-binding subunit ClpX
Protein accession	YP_590635
Protein GI	94968587
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1219] ATP-dependent protease Clp, ATPase subunit
TIGRFAM ID	[TIGR00382] endopeptidase Clp ATP-binding regulatory subunit (clpX)

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.173836
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.00342669
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGAGAACCA GGACTGGTAA CGAAGAAGTA CTTCGCTGTT CTTTCTGCCA TAAATCCCAG 
GATGCCGTCG CGAAGCTAAT CTCTTCGCCG AGCGATTATC CGCGGGCTTA CATCTGCGAC 
GAATGTGTCG CGGTCTGCAA TTCGATTCTC GAAGATGATC GCGCCGAAGC CAGTCCGTCG 
GCCGCTCCGA ACCATCTTCC CAAGCCGCTG GAAGTCAAAA CCTTCCTCGA CGAATACGTC 
ATCGGCCAGG ACCAGACCAA GAAGAAGCTC TCCGTCGCTG TTTACAACCA CTACAAGCGC 
GTTTTCATGA ATCGCCAGCG TAGCGGCGAA GTCGAACTCC AGAAATCGAA CATCCTCTTA 
GTCGGTCCCA CCGGAACCGG CAAAACGCTT TTGGCCCAAA CCTTGGCCAA GATGCTCGAT 
GTTCCCTTCG CGATTGTGGA CGCGACAACT CTCACCGAAG CCGGCTACGT CGGCGAAGAT 
GTCGAGAACA TCATCCTCAA GTTGCTCCAG GCTGCCGACG GCGATGTCGC CCGCGCCCAG 
ACCGGCATCA TCTACATCGA CGAAATCGAC AAGATCGGCC GCAAAGACGA GAACCCGTCC 
ATCACCCGCG ATGTCTCCGG TGAAGGCGTG CAGCAAGCGC TGCTCAAGAT TCTCGAAGGC 
ACCGTCGCAA ACGTTCCGCC TCAAGGCGGT CGTAAGCACC CGCATCAGGA GTTCACACCC 
GTCGATACGA CGAACATTCT CTTCATCGTC GGCGGCGCGT TCGTCGGCTT GGAGAAGATC 
GTTGGCCGTC GCCTCGGCAA GCGCGCCCTC GGCTTCCGCG ACGAGGAAAA AGAAAAGAAC 
TTCACCAGCG CCAACAACCG CGACTCCGAG ATGCTCCAGA GATCCGAACC GCAGGACCTC 
ATCAAGTTCG GTCTCATTCC CGAATTTGTC GGACGCCTCC CCGTCATGGG AGTCCTCAAC 
GACCTCGACG AAAACGCGCT TGTGGAAATC TTGACCAAGC CCAAGAACGC AATCGTGAAG 
CAGTACCAGC GCCTCTTCGA ATTTGAAAAC GTAAAGCTGA AGTTCAGTGA CGAAGCCGTC 
CGCGCCATCG CCCGCGAAGC CATGCAGCGA AAGGTCGGCG CCCGCGGTCT CCGCATGATC 
CTCGAAGAGT TGATGCTCGA CTTGATGTAT AGCTTGCCAA GCCAAAAGCG CGTCAAGGAA 
TTCGAGGTCA CTGCCGAAAT GGTCCAAAAA CGCGACGTCT CCATCAGCCT GATCGAGAAA 
CAAGCCAGCT AA

Protein sequence

MRTRTGNEEV LRCSFCHKSQ DAVAKLISSP SDYPRAYICD ECVAVCNSIL EDDRAEASPS 
AAPNHLPKPL EVKTFLDEYV IGQDQTKKKL SVAVYNHYKR VFMNRQRSGE VELQKSNILL 
VGPTGTGKTL LAQTLAKMLD VPFAIVDATT LTEAGYVGED VENIILKLLQ AADGDVARAQ 
TGIIYIDEID KIGRKDENPS ITRDVSGEGV QQALLKILEG TVANVPPQGG RKHPHQEFTP 
VDTTNILFIV GGAFVGLEKI VGRRLGKRAL GFRDEEKEKN FTSANNRDSE MLQRSEPQDL 
IKFGLIPEFV GRLPVMGVLN DLDENALVEI LTKPKNAIVK QYQRLFEFEN VKLKFSDEAV 
RAIAREAMQR KVGARGLRMI LEELMLDLMY SLPSQKRVKE FEVTAEMVQK RDVSISLIEK 
QAS