Gene BURPS1710b_2480 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_2480
Symbol	clpX
ID	3688453
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007434
Strand	-
Start bp	2749660
End bp	2750931
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	62%
IMG OID	637728936
Product	ATP-dependent protease ATP-binding subunit ClpX
Protein accession	YP_333873
Protein GI	162210030
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1219] ATP-dependent protease Clp, ATPase subunit
TIGRFAM ID	[TIGR00382] endopeptidase Clp ATP-binding regulatory subunit (clpX)

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.958777
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGGACA AGAAAGGTTC GAACAGCGAG AAGCTGTTGT ATTGCTCGTT TTGCGGCAAA 
AGCCAGCATG AGGTGAAGAA GCTCATCGCG GGGCCGTCGG TATTCATCTG CGATGAATGT 
ATCGACTTGT GCAACGAGAT CATCCGCGAC GAAGCGGCCG CGGCGGGCGT CGAAGCCAGC 
CTGTCCAAAT CCGACCTGCC GAGCCCGCAG GAGATTCGCG ACATCCTCGA TCAGTACGTG 
ATCGGCCAGG AGCGCGCGAA GAAGATCCTC GCCGTCGCCG TCTACAATCA CTACAAGCGC 
CTGAAGCATC TCGACAAGAA GGACGATGTC GAGTTGTCGA AGAGCAACAT CCTGTTGATC 
GGCCCGACGG GCTCCGGCAA GACGCTGCTC GCGCAGACCC TCGCGCGCCT GCTGAACGTG 
CCGTTCGTGA TCGCCGACGC GACCACGCTG ACGGAGGCCG GTTATGTCGG CGAGGACGTC 
GAGAACATCA TCCAGAAGCT GCTGCAGAAC TGCAACTACG AGGTCGAGAA GGCGCAGCGC 
GGGATCGTCT ACATCGACGA AATCGACAAG ATCAGCCGCA AGTCGGACAA CCCGTCGATC 
ACCCGCGACG TGTCGGGCGA GGGCGTCCAG CAGGCGCTGC TCAAGCTCGT CGAGGGCACG 
ATGGCGTCGG TGCCGCCGCA GGGCGGCCGC AAGCACCCGA ACCAGGATTT CATCCAGGTC 
GACACCACCA ACATCCTGTT CATTTGCGGC GGCGCGTTCG ACGGCCTCGA GAAGGTGATC 
ACCGACCGCA CCGAGAAGAC CGGCATCGGT TTCGGCGCGA CGGTCAAGAG CAAGCAGGAG 
CGGGACGCGG GCGAAGTGCT GCGCGAGGTC GAGCCGGAAG ACCTGATCAA ATTCGGGTTG 
ATCCCCGAGC TGATCGGCCG TCTGCCGGTG GTCGCGACGC TCGGCAAGCT CGATGAAGCC 
GCGCTGATGA AGATTCTCGT CGAGCCGAAG AACGCGCTCG TCAAGCAGTA TCAGAAGCTG 
TTCGCGATGG AGCGGGTCGA ACTCGAGATT CGTCCGGACG CGCTGCAAGC CGTCGCCCGC 
AAGGCGATCC GCCGCAAGAC GGGCGCGCGC GGGCTGCGTT CGATCATCGA GCAGGCGCTC 
CTCGACGTGA TGTACGAACT GCCGACGCTC AAGGGCGTCA GCAAGGTGAT CATCGACGAC 
AATGTCATCG AAGGAGACGG CAAGCCGTTA TTGATCTATG AGGACACGCC GAAAGTGGCG 
GGTTCGAATT GA

Protein sequence

MADKKGSNSE KLLYCSFCGK SQHEVKKLIA GPSVFICDEC IDLCNEIIRD EAAAAGVEAS 
LSKSDLPSPQ EIRDILDQYV IGQERAKKIL AVAVYNHYKR LKHLDKKDDV ELSKSNILLI 
GPTGSGKTLL AQTLARLLNV PFVIADATTL TEAGYVGEDV ENIIQKLLQN CNYEVEKAQR 
GIVYIDEIDK ISRKSDNPSI TRDVSGEGVQ QALLKLVEGT MASVPPQGGR KHPNQDFIQV 
DTTNILFICG GAFDGLEKVI TDRTEKTGIG FGATVKSKQE RDAGEVLREV EPEDLIKFGL 
IPELIGRLPV VATLGKLDEA ALMKILVEPK NALVKQYQKL FAMERVELEI RPDALQAVAR 
KAIRRKTGAR GLRSIIEQAL LDVMYELPTL KGVSKVIIDD NVIEGDGKPL LIYEDTPKVA 
GSN