Gene Daud_1478 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daud_1478
Symbol	clpX
ID	6026715
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Desulforudis audaxviator MP104C
Kingdom	Bacteria
Replicon accession	NC_010424
Strand	-
Start bp	1563033
End bp	1564286
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	58%
IMG OID	641594296
Product	ATP-dependent protease ATP-binding subunit ClpX
Protein accession	YP_001717616
Protein GI	169831634
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1219] ATP-dependent protease Clp, ATPase subunit
TIGRFAM ID	[TIGR00382] endopeptidase Clp ATP-binding regulatory subunit (clpX)

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0037217
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTAACG AGAAGGGCCA GTTGAAATGT TCGTTTTGCG GTAAGCTGCA GGATCAGGTC 
AAGAAGCTGG TGGCTGGTCC CGGGGTATAC ATTTGTGATG AATGCATAGA GCTTTGCAAC 
GAGATCATCG AGGAGGAACT CAGCGAGGAT CTGGGGCTGG AGTTGCGGGA TATTCCGAAG 
CCGCGGGAAA TCAAGGATTA CCTGGATCAG TACGTGATCG GCCAGGAGTA TGCAAAGAAA 
ATCCTCGCCG TGGCCGTTTA CAACCATTAC AAGCGGATAA ACCTCGGCGG CAAGCTTGAG 
GACGTGGAGC TGCAAAAGAG CAACATTGTC ATGCTCGGGC CGACCGGTTC CGGGAAGACC 
TTGCTGGCGC AGACGCTGGC GCGGTTTCTA AACGTGCCCT TTGCAATCGC CGACGCCACT 
TCGCTGACCG AGGCCGGGTA TGTGGGAGAG GATGTGGAGA ACATCCTCCT GAAGCTCATC 
CAGGCCGCCG ATTACGACGT GGAGAAGGCG GAGAAGGGCA TTGTGTACAT CGACGAGGTC 
GACAAGATCG CGCGTAAGTC GGAAAACCCT TCCATCACCA GGGACGTTTC CGGCGAGGGC 
GTGCAGCAGG CCCTCCTGAA GATTCTGGAG GGTACGGTGG CCAGCGTGCC GCCGCAGGGC 
GGCCGCAAGC ACCCGCACCA GGAGTTCATC CAGCTGGATA CCACAAACAT TCTGTTCATC 
TGCGGCGGGG CCTTTGAGGG GATCGACAAG ATCATCCAGA GCCGGGTGGC TAAGAAGACT 
ATGGGGTTCG GGGCCGAACT GACGCTGAAG CGGGACCGCA AGCTGGGTGA CATCCTGCGG 
AACATCCTGC CCCAGGATCT CTTGAAGTAC GGCCTGATCC CCGAGTTTGT CGGGCGCCTG 
CCGGTCATCG TGACGCTGGA CCCGCTCAAC CAAGAGGACC TGGTCAGGAT CCTGGTTGAG 
CCGCGCAACG CCCTGGTGAA GCAGTATGAG AAGCTCTTCG AAATCGACGG GGTCGCCCTG 
GAGTTTCAGG AAGAAGCGCT CCAGGCCATC GCTGAGGAGG CTATCCGGCG CAACACCGGC 
GCCCGGGGCC TGCGGGCGAT TCTGGAGGAG ATCATGCTGA ACGTCATGTA TGATATTCCG 
TCCCGGGGCG ACGTCGCCAA GTGCACCATT TCGAGGGAAA CGGTCGTGAA CCGGGAGAAC 
CCGCTGATCA TTACCGTGGA GCGCAGCAAG AAGAAAAAGG AAAGTGCCTT GTAA

Protein sequence

MFNEKGQLKC SFCGKLQDQV KKLVAGPGVY ICDECIELCN EIIEEELSED LGLELRDIPK 
PREIKDYLDQ YVIGQEYAKK ILAVAVYNHY KRINLGGKLE DVELQKSNIV MLGPTGSGKT 
LLAQTLARFL NVPFAIADAT SLTEAGYVGE DVENILLKLI QAADYDVEKA EKGIVYIDEV 
DKIARKSENP SITRDVSGEG VQQALLKILE GTVASVPPQG GRKHPHQEFI QLDTTNILFI 
CGGAFEGIDK IIQSRVAKKT MGFGAELTLK RDRKLGDILR NILPQDLLKY GLIPEFVGRL 
PVIVTLDPLN QEDLVRILVE PRNALVKQYE KLFEIDGVAL EFQEEALQAI AEEAIRRNTG 
ARGLRAILEE IMLNVMYDIP SRGDVAKCTI SRETVVNREN PLIITVERSK KKKESAL