Gene GM21_3010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3010
Symbol	clpX
ID	8138356
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3497592
End bp	3498845
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	60%
IMG OID	644870611
Product	ATP-dependent protease ATP-binding subunit ClpX
Protein accession	YP_003022797
Protein GI	253701608
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1219] ATP-dependent protease Clp, ATPase subunit
TIGRFAM ID	[TIGR00382] endopeptidase Clp ATP-binding regulatory subunit (clpX)

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	84
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGCAGAA GAGATGACCG TTCCGACACG CTGATCTGTT CCTTTTGCGG GAAGAGCCAG 
GAAGAGGTGA AGAAGCTGAT TGCGGGGCCT ACGGTCTACA TCTGCGACGA GTGCATCGAG 
CTTTGCAACG ACATCATCGC GGAGGAGTCC AAACTGGAGG ATGCCACCGC AACCGATGTG 
AGGAAACTTC CCAAGCCGCA GGAAATCAAG GAAGTCCTCG ATGAATACGT GATCGGCCAG 
TCCAGGGCGA AAAAGGTCCT GGCCGTAGCC GTGTACAACC ATTACAAGAG GGTCGAGGCC 
GCGGTGAAGC CGGGCGACGT CGAGATGCAG AAGAGCAACA TCCTGCTTCT GGGCCCAACA 
GGCAGCGGCA AAACGCTCCT GGCGCAGACC CTGGCCCGCA TCCTCAAGGT GCCTTTCGCC 
ATGGCGGACG CCACCAACTT GACCGAGGCG GGTTACGTCG GCGAGGACGT GGAGAACATC 
ATCCTGACCC TCTTGCAGGC GTCCGATTAC GACGTGGAGA AGGCGCAGAA GGGGATCATC 
TACATCGACG AGATCGACAA GATCGCCAGG AAATCCGACT CGCCCTCCAT CACCCGCGAC 
GTTTCGGGCG AGGGGGTGCA GCAGGCCCTT TTGAAGATCA TCGAAGGGAC CGTGGCGAGC 
GTCCCCCCCA AGGGTGGGCG CAAGCACCCG CAGCAGGAGT TCCTTAAGGT GGACACCACC 
AACATCCTGT TCATCTGCGG CGGGGCCTTC CCCGGGTTGG ACAGCATCAT CCAGCAGAGG 
ATCGGGGTCA AGACGCTCGG CTTCGGCGCG GACGTCAAGA AGAAGGTGGA GAAGAAGGCG 
GGCGAACTGC TGGCCGGGGT GACCCCTGAG GATCTCTTGA AGTTCGGTTT CATCCCCGAG 
TTCGTGGGGC GTCTTCCCAT GCTCGCCTCG CTCTCCGAGC TCGACGAGGA GGCGATGGTC 
CAGATCCTCA AGGAGCCGAA GAACGCGCTG ATCAAGCAGT ACCAGAAGCT GTTCGATATG 
GAGCACGTGA AGCTGAAGTT CACCGACGGC TCCCTGGTCG CCATAGCACG CGAGGCCCTG 
AAGCGAAAGA CCGGCGCCCG CGGCCTGCGC TCCATCCTGG AAAACGCGAT GCTGGACATC 
ATGTACGAGA TCCCCTCCCA GAGCATGGTG AAGGAAGTGG TCATCAACGA AGAGGTGATC 
TACAGCAAGG AAAAGCCGAT CATCGTCTAC GAGAACGTGG CGGAAAGCGC CTGA

Protein sequence

MSRRDDRSDT LICSFCGKSQ EEVKKLIAGP TVYICDECIE LCNDIIAEES KLEDATATDV 
RKLPKPQEIK EVLDEYVIGQ SRAKKVLAVA VYNHYKRVEA AVKPGDVEMQ KSNILLLGPT 
GSGKTLLAQT LARILKVPFA MADATNLTEA GYVGEDVENI ILTLLQASDY DVEKAQKGII 
YIDEIDKIAR KSDSPSITRD VSGEGVQQAL LKIIEGTVAS VPPKGGRKHP QQEFLKVDTT 
NILFICGGAF PGLDSIIQQR IGVKTLGFGA DVKKKVEKKA GELLAGVTPE DLLKFGFIPE 
FVGRLPMLAS LSELDEEAMV QILKEPKNAL IKQYQKLFDM EHVKLKFTDG SLVAIAREAL 
KRKTGARGLR SILENAMLDI MYEIPSQSMV KEVVINEEVI YSKEKPIIVY ENVAESA