Gene Caul_2846 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2846
Symbol	clpX
ID	5900301
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3085645
End bp	3086907
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	63%
IMG OID	641563342
Product	ATP-dependent protease ATP-binding subunit ClpX
Protein accession	YP_001684471
Protein GI	167646808
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1219] ATP-dependent protease Clp, ATPase subunit
TIGRFAM ID	[TIGR00382] endopeptidase Clp ATP-binding regulatory subunit (clpX)

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.0298262
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0252217
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAAAG CCGCGAGCGG CGACACCAAG AGCACCCTCT ACTGTTCTTT CTGCGGAAAG 
AGTCAGCATG AGGTGCGTAA GCTCATCGCG GGGCCGACGG TGTTCATCTG CGATGAATGC 
GTCGAGCTTT GCATGGATAT CATCCGTGAA GAGCACAAGA TCGCCTTCGT GAAGTCCAAG 
GACGGCGTGC CGACGCCGCG CGAGATCTGC GAAGTCCTGG ACGATTACGT GATTGGGCAA 
AATCACGCCA AGAAGGTGCT CGCGGTCGCG GTGCACAATC ACTACAAGCG CCTCAACCAC 
GCCTCGAAGA ACAACGACGT CGAGCTGGCC AAATCGAACA TCCTGCTGGT CGGCCCGACC 
GGTACGGGCA AGACGCTGCT GGCCCAGACC CTGGCCCGAA TCATCGACGT GCCGTTCACG 
ATGGCCGACG CCACCACCCT GACCGAAGCC GGTTATGTGG GCGAAGACGT CGAGAACATC 
GTGCTCAAGC TGCTCCAGGC CGCCGACTAC AATGTCGAGC GTGCTCAACG CGGCATCGTC 
TACATCGACG AAATCGACAA GATCAGCCGC AAGTCCGACA ATCCGTCGAT CACGCGCGAC 
GTGTCCGGCG AAGGCGTGCA GCAGGCCCTG CTGAAGATCA TGGAAGGCAC CGTCGCCTCC 
GTGCCGCCGC AAGGCGGGCG CAAGCATCCG CAGCAGGAGT TCCTGCAGGT CGACACCACC 
AACATCCTGT TCATCTGCGG CGGGGCCTTC GCGGGCCTGG AGCGCATCAT CTCGGCGCGC 
GGCCAGGGCA AGTCGATCGG CTTCGGCGCC AAGGTGGCGG ATCCGGAAGA GCGTCGCACG 
GGCGAGATCC TGCGTGGCGT CGAGCCCGAC GACCTGCAGC GCTTCGGCCT GATCCCGGAA 
TTCATCGGCC GCCTGCCGGT GATCGCCACC CTTGAGGACC TCGACGAGGC CGCCCTGGTG 
AAGATCCTGA CCGAGCCGAA GAACGCCTTC GTCAAGCAGT ACCAGCGCCT GTTCGAGATG 
GAGAACATCG GCCTGACCTT CACCGAGGAC GCCCTGCACG GCGTCGCCAA GAAGGCCATT 
CTGCGCAAGA CCGGCGCGCG GGGGCTGCGC TCGATCATGG AGGGCATCCT GCTGGAGACC 
ATGTTCGAAC TGCCCAACTA CGAGGGCGTC GAGGAAGTGG TGGTCAACGC CGAGGTCGTC 
GAAGGCCGGG CTCAGCCGCT GCTGATCTAC GCCGAGAAGA AGGGCGGGGC CGCTTCGGCC 
TAA

Protein sequence

MTKAASGDTK STLYCSFCGK SQHEVRKLIA GPTVFICDEC VELCMDIIRE EHKIAFVKSK 
DGVPTPREIC EVLDDYVIGQ NHAKKVLAVA VHNHYKRLNH ASKNNDVELA KSNILLVGPT 
GTGKTLLAQT LARIIDVPFT MADATTLTEA GYVGEDVENI VLKLLQAADY NVERAQRGIV 
YIDEIDKISR KSDNPSITRD VSGEGVQQAL LKIMEGTVAS VPPQGGRKHP QQEFLQVDTT 
NILFICGGAF AGLERIISAR GQGKSIGFGA KVADPEERRT GEILRGVEPD DLQRFGLIPE 
FIGRLPVIAT LEDLDEAALV KILTEPKNAF VKQYQRLFEM ENIGLTFTED ALHGVAKKAI 
LRKTGARGLR SIMEGILLET MFELPNYEGV EEVVVNAEVV EGRAQPLLIY AEKKGGAASA