Gene Mext_2009 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_2009
Symbol	hslO
ID	5831204
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	2240345
End bp	2241352
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	71%
IMG OID	641367809
Product	Hsp33-like chaperonin
Protein accession	YP_001639478
Protein GI	163851435
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1281] Disulfide bond chaperones of the HSP33 family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.729287
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTCCG GACACGCCCC TTCTTTCACA CCCTCGCTCG AAGGCGACGA CGACGCCGTT 
CTGCCGTTCG CCGTCGAAGC ACTGGATCTG CGCGGCCGCG CGGTGCGGCT CGGGCCCTCG 
ATCGACACCA TCCTGCGCCG CCACGGCTAT CCCGACGCGG TCGCCCGGCT GATCGGCGAG 
GCGGCGGCGC TCACCGTGCT GCTCGGTGCC TCCCTGAAGC TCGAAGGCCG CTTCCAGCTC 
CAGACCAAGA CCGACGGACC GGTGAACATG CTGGTGGTCG ATTTCGAGGC GCCCGACCGG 
GTGCGAGCCA CCGCCCGCTT CGATGCGGAG CCGGTGGCTG CCCTCGGCCC GAAGGCGCGC 
GCCGCTGACC TGATGGGTCG TGGGCACCTG GCCATGACCA TCGACCAGGG GCCATCCCAG 
AGCCGCTACC AGGGCGTCGT CGCGCTCGAG GGCCAAAGCC TCGAAGAGGC CGCGCACCAG 
TATTTCCGCC AATCCGAGCA GATCCCGACG CTGGTCCGCC TCGCCGTCGC CGAGCAGATG 
GAGGGCGGGG AGAGCCGCTG GAGAGCCGGC GGCCTGCTGG TGCAGTTCCT GCCGACCTCG 
CCCGACCGGA TGCGCCAGGC CGACCTTCCG CCCGGCGACG CGCCGGAGGG CCACGAGATC 
CTCACCGGTG GCACCCGCGA CGACGATGCC TGGACCGAGG CGCGCAGCCT CGTGAACACG 
GTGGAGGACC ACGAGATCGT CGATCCGGCG GTGTCGAGCG AGCGGTTGCT CTACCGCCTG 
TTCCACGAGC GCGGCGTGCG CGTGTTCGAT GCGCAGAGCG TGATCGAGCG CTGCCGCTGC 
TCGGAAGAGC GGGTGCTGGG GATGATCCGC TCGTTCTCCG CCGAGGAGCG CCGGGACATG 
GTCGCGGATG ACGGCACCGT GTCCATCACC TGCGAGTTCT GCTCGCGCCG CTACGTGCTC 
GATCCGGCCG AGGTCGAGCG GGATATCGCG ACCGCGCCGG GGGCGTGA

Protein sequence

MSSGHAPSFT PSLEGDDDAV LPFAVEALDL RGRAVRLGPS IDTILRRHGY PDAVARLIGE 
AAALTVLLGA SLKLEGRFQL QTKTDGPVNM LVVDFEAPDR VRATARFDAE PVAALGPKAR 
AADLMGRGHL AMTIDQGPSQ SRYQGVVALE GQSLEEAAHQ YFRQSEQIPT LVRLAVAEQM 
EGGESRWRAG GLLVQFLPTS PDRMRQADLP PGDAPEGHEI LTGGTRDDDA WTEARSLVNT 
VEDHEIVDPA VSSERLLYRL FHERGVRVFD AQSVIERCRC SEERVLGMIR SFSAEERRDM 
VADDGTVSIT CEFCSRRYVL DPAEVERDIA TAPGA