Gene Noca_3475 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3475
Symbol	clpX
ID	4595572
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	3685095
End bp	3686375
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	66%
IMG OID	639778081
Product	ATP-dependent protease ATP-binding subunit ClpX
Protein accession	YP_924662
Protein GI	119717697
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1219] ATP-dependent protease Clp, ATPase subunit
TIGRFAM ID	[TIGR00382] endopeptidase Clp ATP-binding regulatory subunit (clpX)

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCACGTA TCGGTGACGG AGGCGACCTG CTCAAGTGCT CGTTCTGCGG GAAGAGCCAG 
AAGCAGGTCA AGAAGCTGAT CGCGGGCCCC GGCGTCTACA TCTGCGACGA GTGCATCGAC 
CTGTGCAACG AGATCATCGA GGAGGAGCTC AGCGAGGGCG CCGAGGTCAG CCTCGACGAG 
CTGCCGAAGC CCAAGGAGAT CTTCGAGTTC CTCAACTCCT ACGTCATCGG CCAGGAGCAG 
GCCAAGAAGT CACTCGCCGT CGCGGTCTAC AACCACTACA AGCGGGTGCA GGCCGGCCTC 
CAGCCCATGT CGGGCAAGCA CAGCAAGGAG GAGGTCGTCG AGGTCGCCAA GTCCAACATC 
TTGGTGATCG GCCCCACCGG CTGCGGCAAG ACCTACCTCG CGCAGACCCT GGCCCGGATG 
CTCAACGTGC CGTTCGCGAT CGCCGACGCC ACCGCGCTCA CCGAGGCCGG CTACGTCGGT 
GAGGACGTCG AGAACATCCT GCTCAAGCTG ATCCAGGCCG CCGACTACGA CGTCAAGAAG 
GCCGAGACCG GCATCATCTA CATCGACGAG ATCGACAAGG TGGCCCGCAA GGCGGAGAAC 
CCCTCGATCA CCCGCGACGT CTCCGGCGAG GGCGTCCAGC AGGCGCTGCT CAAGATCATC 
GAGGGCACCA CCGCCTCGGT CCCGCCGCAG GGCGGCCGCA AGCATCCCCA CCAGGAGTTC 
ATCCAGATCG ACACCACGAA CATCCTGTTC GTCGTGGGTG GGGCGTTCGC CGGGCTGGAG 
CACATCATCG AGCAGCGGGT CGGCAAGAAG ACCCTCGGCT TCACCGCCGA GGTCCGCGGC 
AAGGCCGAGC GCGAGGCCGA GGACCTGCTC GCCCAGGTCC GGCCCGAGGA CCTCACGAAG 
TTCGGCCTGA TCCCCGAGTT CATCGGCCGG CTGCCGCTGA TCGCGAGCGT GAGCAAGCTC 
GACCAGGAGG CCCTCGTGCA GATCCTCACC GAGCCGCGCA ACGCCCTGGT CAAGCAGTAC 
CAGAAGCTCT TCGAGCTCGA CGGTGTCGAG CTCGAGTTCA CCCCCGACGC CATCGAGGCG 
ATCGCCGACA ACGCGCTCGA GCGCGGCACC GGTGCCCGTG GCCTGCGCGC GATCATCGAG 
GAGGTCCTCC TCCACGTGAT GTACGACGTG CCCTCGCGTG GCGACATCGC GAAGGTGATC 
GTCACCCGCG AGGTCGTCAT GGACGGGGTC TCGCCGACCC TGATCCCGCG CGAGTCGGAG 
AAGAAGAAGA AGTCCGCGTA G

Protein sequence

MARIGDGGDL LKCSFCGKSQ KQVKKLIAGP GVYICDECID LCNEIIEEEL SEGAEVSLDE 
LPKPKEIFEF LNSYVIGQEQ AKKSLAVAVY NHYKRVQAGL QPMSGKHSKE EVVEVAKSNI 
LVIGPTGCGK TYLAQTLARM LNVPFAIADA TALTEAGYVG EDVENILLKL IQAADYDVKK 
AETGIIYIDE IDKVARKAEN PSITRDVSGE GVQQALLKII EGTTASVPPQ GGRKHPHQEF 
IQIDTTNILF VVGGAFAGLE HIIEQRVGKK TLGFTAEVRG KAEREAEDLL AQVRPEDLTK 
FGLIPEFIGR LPLIASVSKL DQEALVQILT EPRNALVKQY QKLFELDGVE LEFTPDAIEA 
IADNALERGT GARGLRAIIE EVLLHVMYDV PSRGDIAKVI VTREVVMDGV SPTLIPRESE 
KKKKSA