Gene BURPS1106A_2628 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2628
Symbol	hsp33
ID	4902571
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	2589108
End bp	2590058
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	67%
IMG OID	640135855
Product	chaperonin, 33 kDa
Protein accession	YP_001066881
Protein GI	126454324
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1281] Disulfide bond chaperones of the HSP33 family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.202437
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCGACC AGTTACAGAA ATTCATGTTC AACGCAGCCC CGGTGCGCGG CGAGATCGTC 
TCGCTGCGCA GCACGTGGCA AGAGGTGCTC ACGCGCCGCG ACTACCCGAC GCCCGTGCGC 
AACGTGCTCG GCGAGATGAT GGCGGCGTGC GCGCTGCTGT CGGCGAACCT GAAGTTCGAC 
GGCACGCTCA TCATGCAGAT CTTCGGCGAC GGGCCGGTGA AGATGCTCGT CGTCCAGTGC 
AGCTCGGATC TCGCGATGCG CGCGACCGCG AAATTCTCGG GCGACGCCGC GCGAACCGTC 
GGCGACGGCA CTTCGTTCGC CGAACTGATC AATGCGAGCG GCCACGGCCG TTGCGTGATC 
ACGCTCGATC CGGCCGACAA GCGTCCCGGC CAGCAGCCCT ATCAGGGCAT CGTGCCGCTG 
AACGGCGAAG ACGGCCCGCT CGCGTCGATC GCCGACGTGC TCGAGCACTA CATGCGCCAT 
TCCGAGCAGC TCGACACGCG CCTCTGGCTC GCCGCCGACC ACGATCGCGC GGTCGGCGTG 
CTGCTGCAGA AGCTGCCGGG CGACGGCGGC ATCGTGCCGC GCGTCGAGCA AACCGATACG 
GATACATGGG AGCGCGTGTG CACGCTCGGC GGCACGCTGT CGTCGAAAGA GCTGCTCGAA 
GTGGAACCCG AGACCGTGTT TCGGCGTCTG TTCTGGCAGG AGAATGTGCA GCACTTCGAA 
CCGACGTCCA CGCGCTTCCA GTGCACGTGC TCGCGCGAGA AAGTCGGCGG GATGCTGCGC 
ATGCTCGGGC GCGTCGAGAT CGACGGCGTG ATCGAAGAGC GCGGCCACGT CGAGATCCAC 
TGCGAATTCT GCAATCAGCG CTACGAATTC GATCCGGTCG ACGTCGCCCA GCTGTTCTCG 
ACGCCCGAGC TCGGCACCGG GGTCGCGCCC GCCGCCGCGC AACGGCACTG A

Protein sequence

MSDQLQKFMF NAAPVRGEIV SLRSTWQEVL TRRDYPTPVR NVLGEMMAAC ALLSANLKFD 
GTLIMQIFGD GPVKMLVVQC SSDLAMRATA KFSGDAARTV GDGTSFAELI NASGHGRCVI 
TLDPADKRPG QQPYQGIVPL NGEDGPLASI ADVLEHYMRH SEQLDTRLWL AADHDRAVGV 
LLQKLPGDGG IVPRVEQTDT DTWERVCTLG GTLSSKELLE VEPETVFRRL FWQENVQHFE 
PTSTRFQCTC SREKVGGMLR MLGRVEIDGV IEERGHVEIH CEFCNQRYEF DPVDVAQLFS 
TPELGTGVAP AAAQRH