Gene Anae109_2266 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_2266
Symbol	clpX
ID	5374270
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	-
Start bp	2573916
End bp	2575196
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	67%
IMG OID	640843784
Product	ATP-dependent protease ATP-binding subunit ClpX
Protein accession	YP_001379452
Protein GI	153005127
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1219] ATP-dependent protease Clp, ATPase subunit
TIGRFAM ID	[TIGR00382] endopeptidase Clp ATP-binding regulatory subunit (clpX)

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.0952639
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.0216223
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCCGGA AAGACCATCA CGGCAACCTG TCGTGCTCGT TCTGTGGGAA GGGGCAACGG 
GAGGTCCGCA AGCTCATCGC CGGGCCCACG GTCTACATCT GCGACGAGTG CATCCGGCTC 
TGCAACGACA TCATCGCGGA GGAGGCCGAG CGCGACGAGG GCCGCCCCGC GGTCTCGCTG 
CCCACTCCCG CCGAGATCAA GAGCTTCCTC GACGACTACG TGGTCGGGCA GGACAAGGCG 
AAGAAGGTCC TGTCCGTCGC CGTCTACAAC CACTACAAGC GCGTCTACTC GAAGAAGCCG 
GCCCGCCCGC AGCGCCCCGG ACAGACCAGG ACCGGCTCGG ACGACGTCGA GCTTCAGAAG 
TCGAACATCC TGCTCATCGG GCCGACGGGC TCGGGCAAGA CGCTCCTCGC GCAGTCGCTC 
GCCCGCTTCC TCAACGTCCC CTTCACGATC GCGGACGCCA CCAGCCTCAC CGAGGCCGGC 
TACGTCGGCG AGGACGTCGA GAACATCATC CAGAACCTGC TCCACGCGGC GGACTACGAC 
GTGGAGAAGG CCGCGCGCGG CATCGTCTAC GTCGACGAGA TCGACAAGAT CGCCCGCAAG 
GGCGACTCGC CGTCCCCCAC CCGCGACGTC GGCGGCGAGG GCGTCCAGCA GGCGCTGCTC 
AAGATCATCG AGGGCACGCG CGCCAACGTC ACCCCGCGCG GCGGCAAGAA GTACAACCAG 
CAGGAGTACA TCCAGGTCGA CACCTCGAAC ATCCTCTTCA TCGTCGGCGG CGCGTTCTGC 
GGGCTGGAGC AGGTGATCCG GCGCCGCGCG GGCGTGAAGG CCCTCGGGTT CGGGGCGAAG 
ATCGAGCGCA AGGAGGAGGC GAGCCTCGGC GAGCTCCTCG CGCGCGTCGA GCCGTCGGAT 
CTCGTGAAGT TCGGGATGAT CCCCGAGTTC GTGGGGCGCC TCCCGATCAT CGCGACGCTC 
GCCGACCTCT CCGAGGAGGA CCTGGTCACC ATCCTCACCC AGCCGAAGAA CGCGCTCACG 
AAGCAGTACG TGAAGCTCTT CGAGCTCGAG AAGGTGAAGC TCTCCTTCAC GAAGGAGTCG 
CTGCGCGCCA CCGCACGCGA GGCGATGCGG CGGAAGTCGG GCGCCCGCGG GCTCCGCGCC 
ATCCTCGAGC AGGCGATGCT CGACATCATG TACGACGTGC CGTACCGGGA AGGCGTGAAG 
GAGTGCAAGA TCACAGACGG CGTGATCCTG AACAAGGAGC CTCCGCTCCT GTCCTTCGAG 
AAAGAGAAGA AGCTCGCCTA G

Protein sequence

MSRKDHHGNL SCSFCGKGQR EVRKLIAGPT VYICDECIRL CNDIIAEEAE RDEGRPAVSL 
PTPAEIKSFL DDYVVGQDKA KKVLSVAVYN HYKRVYSKKP ARPQRPGQTR TGSDDVELQK 
SNILLIGPTG SGKTLLAQSL ARFLNVPFTI ADATSLTEAG YVGEDVENII QNLLHAADYD 
VEKAARGIVY VDEIDKIARK GDSPSPTRDV GGEGVQQALL KIIEGTRANV TPRGGKKYNQ 
QEYIQVDTSN ILFIVGGAFC GLEQVIRRRA GVKALGFGAK IERKEEASLG ELLARVEPSD 
LVKFGMIPEF VGRLPIIATL ADLSEEDLVT ILTQPKNALT KQYVKLFELE KVKLSFTKES 
LRATAREAMR RKSGARGLRA ILEQAMLDIM YDVPYREGVK ECKITDGVIL NKEPPLLSFE 
KEKKLA