Gene BURPS1106A_A0244 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A0244
Symbol	clpB
ID	4904425
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	231358
End bp	234297
Gene Length	2940 bp
Protein Length	979 aa
Translation table	11
GC content	72%
IMG OID	640143351
Product	chaperone clpB
Protein accession	YP_001074287
Protein GI	126456099
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0542] ATPases with chaperone activity, ATP-binding subunit
TIGRFAM ID	[TIGR03345] type VI secretion ATPase, ClpV1 family

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.707407
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGATCT CGCGTCAGGC GCTGTTCGGG AAACTCGGGG CCACGCTCTT CAGGGCGATC 
GAATCGGCCA CGGTTTTCTG CAAGCTGCGC GGCAATCCGT ACGTCGAGCT GGTGCACTGG 
CTGCAGCAGT TGTTGCAGCA GTCCGACTCC GATCTGCACC GGATCGTGCG GCACGCCGGC 
ATCGAGCGCG ACGCGCTCGA TCGCGACATC GCGCGCGCGC TCGCCACGCT GCCGGCCGGC 
GCGGGCTCGA TCAGCGATTT TTCCCATCAC GTCGAAGCCG CGATCGAGCG CGCATGGGTG 
CTCGCAACGC TGCGCTTCGG CGACCGGCGC ATCCGCGGCG CATGGCTCGT CGCCGCGCTC 
GTCGATACGC CGGAACTGCG GCGCGTGCTG CTTTCCATTT CGCCGGCGTT CGCGAGGATT 
CCTCACGACG ACGCTCTCGA CGACGTGCTG CCCGCGTGGA CGGCCGGTTC GCCGGAAGCG 
GCGGACGCGC CGTACGACCA CGTCGATTCC GCGCCCGCTT CGCCGGGCGA GCCGTCCGGC 
GCGACGCGCG CCGCGCCGAA CGGCTCGCCG CTCGAGCGAT ATTGCACGGA CCTGACCGCG 
CGCGCGCGCG ACGGCGACAT CGACCCCGTC ATCGGGCGCG AGCTCGAAAT CCGCACGATG 
ACCGACGTGC TGCTGCGGCG CAGGCAGAAC AATCCGCTGC TCACCGGCGA GGCGGGCGTG 
GGCAAGACGG CCGTCGTCGA GGGCCTCGCG CTCGCGATCG CGAACGGCGA CGTGCCGCCG 
AAGCTGGCCG ACGTGCGCCT GATGAGCGTC GACGTGGGCG CGCTGCTGGC CGGCGCGGGC 
ATGAAAGGCG AATTCGAATC GCGCCTGAAA GGCGTGCTCG AGGCCGCGGC GAAATCCGTC 
GCGCCCGTCA TCCTGTTCGT CGACGAGATT CACACGCTGA TCGGCGCGGG CGGACAGGCC 
GGCACGGGCG ACGCGGCGAA CCTGCTCAAG CCCGCGCTCG CGCGCGGCAC GATCCGCACG 
ATCGGCGCGA CGACATGGGC GGAGTACAAG CGGCACATCG AAAAGGATCC CGCATTGACC 
CGCCGCTTTC AGGTGCTGCA AGTGCCGGAG CCCGAAGAGC CGGCCGCGGT GCACATGGTG 
CGGGGCGTCG CGCGAGCGTT CGCGCGGCAC CACCGCGTGA CGGTGCGCGA CGAGGCGATC 
CGCGCCGCCG TCGCGCTGTC GCACCGCTAC ATTCCGTCGC GGCATCTGCC GGACAAGGCG 
ATCAGCCTCC TCGACACCGC ATGCGCGCGC GTCGCGCTCT CGCAGCACGC CGCGCCCGGC 
GAACTGCAGC ACGTACGCCA GCGCTTGCTC GCGGCGCGCG CCGAGCGCGA TCTGCTCGAA 
CAGGAGGCGC GCATCGGGCT CGACGCCGGG CAATCGCTCG CGGCGGTGCG CGAACGCATC 
GAAGCGCTCG CGGCCGAGGA AGCGGCCGTC GACGCGCGCT GGAAGGCGCA GGCCGACGCG 
GCGCGCGCGC TGCTCGCCGC GCGCGAGGCC GCACTCGCGG AATGTCACCG CGAGTCTTGC 
TCCGAAACGC GCGCCGGCTC GCTCTCCGAA TCTCGTACCG AATCTCGTAC CGAATCGCGC 
GCCAGATCAC ACATCGACTC CAGCGCCTAT GCTCACAGCG ACGTCCCGGC CGAAATGCAC 
GTCGGCTCGC ACGCCGGCTC GCGCGCCGCA ACGTGTCCGG ACACGCACGC CGAAGCGCAC 
GCCGCCCCCG CCTCGCCCCC GCCCGCCGCC GATACGCCGC ACGCCGGCGC CGCCCCCGGG 
CTGCGCGAGC TCGAACGCGC GCTCGCGGCG GCCCAGGGCG ACGCACCGCT CGTGTTCCCG 
GAAGTCGACG AGACGATCGT CGCGCAGATC GTCGCGGATT GGACCGGCAT TCCGGTCGGC 
CGCATGATGA CCGACGAAGT CGCCGCCGTG CGCGCGCTGC CCGCGACGCT CGAGGCGCGC 
GTGATCGGCC AGCCCGACGC GCTGCGGCAG ATCGGCGAGC GCGTGCAGAC CGCGCGCGCG 
GGCCTCGCCG ATCCGAAGAA GCCGCTCGGC GTATTCCTGC TTGCGGGCCC GTCGGGCGTC 
GGCAAGACCG AAACGGCGCT CGCGCTCGCC GAGGCGCTGT ACGGCGGCGA ACAGAGCCTG 
ATCACGATCA ACATGAGCGA GTACCAGGAA GCCCACACCG TGTCGGGCCT CAAGGGCGCG 
CCGCCCGGCT ATGTCGGCTA CGGCGAGGGC GGCGTGCTGA CCGAGGCGGT GCGGCGGCGG 
CCGTACAGCG TCGTGCTGCT CGACGAGATC GAGAAGGCGC ACCGCGACGT GCACGAACTC 
TTCTTCCAGG TCTTCGACAA GGGCTACATG GAAGACGGCG ACGGCCGCTA CATCGATTTC 
CGCAACACGA CGATCCTGCT CACGAGCAAC GTCGGCGCGG AACTGAGCGC GAGCCTGTGT 
GCCGACGCAT CGCTCGCGCC CGATGCCGCC GCGCTGCGCG ACGCGCTCAT GCCCGAACTG 
CTGAAGGTCT TCCCCGCCGC GTTCCTCGGG CGCGTGAGCG TCGTGCCGTA CCGGCCGCTC 
GAAGCGCGCG CGCTCGCGCG CATCGTGCGC CTGCATCTGG ATCGCGTCGT CGCGCGCATG 
GCCGAGCGGC ACCGCATCGC GCTCGCGTAC GACGACGCCG TCGTCGACTA CGTCGTCGGG 
CGTTGCCTCG TGCAGGAAAC CGGCGCGCGG CTGCTGATCG GATTCATCGA GCAGCACGTG 
CTGCCTCGGC TGTCCGCGCT GTGGCTCGAC GCGTTCCCGT CGAAGGCGGC GCTCGCGCGC 
ATCGACATCG GTGTGGCCGA CGCGGCCGCG CCCGCGGCGC GCGCGCTCGT CTTCCGGCCC 
GGCCAAGCAA GCCGGGCGGG GCCGCCGAAC GCGCCGCTCA CCGCCGTGCA GGCCGGCTAG

Protein sequence

MAISRQALFG KLGATLFRAI ESATVFCKLR GNPYVELVHW LQQLLQQSDS DLHRIVRHAG 
IERDALDRDI ARALATLPAG AGSISDFSHH VEAAIERAWV LATLRFGDRR IRGAWLVAAL 
VDTPELRRVL LSISPAFARI PHDDALDDVL PAWTAGSPEA ADAPYDHVDS APASPGEPSG 
ATRAAPNGSP LERYCTDLTA RARDGDIDPV IGRELEIRTM TDVLLRRRQN NPLLTGEAGV 
GKTAVVEGLA LAIANGDVPP KLADVRLMSV DVGALLAGAG MKGEFESRLK GVLEAAAKSV 
APVILFVDEI HTLIGAGGQA GTGDAANLLK PALARGTIRT IGATTWAEYK RHIEKDPALT 
RRFQVLQVPE PEEPAAVHMV RGVARAFARH HRVTVRDEAI RAAVALSHRY IPSRHLPDKA 
ISLLDTACAR VALSQHAAPG ELQHVRQRLL AARAERDLLE QEARIGLDAG QSLAAVRERI 
EALAAEEAAV DARWKAQADA ARALLAAREA ALAECHRESC SETRAGSLSE SRTESRTESR 
ARSHIDSSAY AHSDVPAEMH VGSHAGSRAA TCPDTHAEAH AAPASPPPAA DTPHAGAAPG 
LRELERALAA AQGDAPLVFP EVDETIVAQI VADWTGIPVG RMMTDEVAAV RALPATLEAR 
VIGQPDALRQ IGERVQTARA GLADPKKPLG VFLLAGPSGV GKTETALALA EALYGGEQSL 
ITINMSEYQE AHTVSGLKGA PPGYVGYGEG GVLTEAVRRR PYSVVLLDEI EKAHRDVHEL 
FFQVFDKGYM EDGDGRYIDF RNTTILLTSN VGAELSASLC ADASLAPDAA ALRDALMPEL 
LKVFPAAFLG RVSVVPYRPL EARALARIVR LHLDRVVARM AERHRIALAY DDAVVDYVVG 
RCLVQETGAR LLIGFIEQHV LPRLSALWLD AFPSKAALAR IDIGVADAAA PAARALVFRP 
GQASRAGPPN APLTAVQAG