Gene Mpe_A2014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A2014
Symbol
ID	4784234
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	2159223
End bp	2160188
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	72%
IMG OID	640090584
Product	putative redox regulated molecular chaperone heat-shock-like protein
Protein accession	YP_001021207
Protein GI	124267203
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1281] Disulfide bond chaperones of the HSP33 family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.458338
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAAC TCCATAAATT CATCTTCGAG GGCCTGCCGG TGCGCGGCAT GCTGGTGCGT 
TTGACCGGCG CGTGGACCGA ACTGCTGGCA CGCCGGGGGA CAGAGCGGGC GCATCCGGCG 
CCGGTGCGCA CGCTGCTCGG CGAGATGGCG GCCGCCGGGG TGCTGATGCA GGCCAGCATC 
AAGTTCAACG GCGCACTGGT GCTGCAGATC TCGGGCGACG GGCCGGTGAA GCTGGCGGTG 
GCCGAGGTGC AGCCCGACCT GGCGCTGCGG GCCACGGCCA CGGTGGTCGG CGACGTGCCG 
GCCGGCGCGC GGCTGGAGGC GCTGGTCAAC GTGGGCGGGC GCGGCCATTG CGCGATCACG 
CTGGACCCCA AGGACCGCTA CCCGGGCCAG CAGCCCTATC AGGGCGTGGT GCCGCTGCAT 
GGTGACCGGC GCGAGCCGCT GCAGCAGCTG TCGGAGGTGC TGGAGCACTA CATGCTGCAG 
TCGGAGCAGC TCGACACCAA GCTCGTGCTG GCGGCGAACG ACGACGTGGC CGCCGGCCTG 
CTGATCCAGC GCCTGCCGGT CGAGGGCGAA GGCAACCTCG GCGCGCGGAA CGAGGACGAG 
ATCGGCCTCA ACGAGGCCTA CAACCGCATC GCCCACCTCA GTGCGACGCT GACGCGCGAG 
GAGTTGCTGA CGCTGGACGC CGACACCCTG CTGCGGCGGC TGTTCTGGGA GGAGACCGTG 
CGCCGCTTCG AGCCGCTGAC CGGCGAGCAC GGGCCGCGCT TCGCCTGCAG CTGCTCGCGG 
GAGCGCGTGG CGCGCATGCT GCGCGGCCTG GGGCGCGAGG AGTTCGACGG CCTGATCGCC 
GAGCGCGGGC TGGCCGAGGT GGGCTGCGAG TTCTGTGGCG CCCAGTACCA CTTCGATGCG 
GTCGACGGCG GCGAGGTCTT CACGGCGCCC CGCGACCAGC CGCCGGCCTC GCGCGCCGTG 
CAGTAG

Protein sequence

MSELHKFIFE GLPVRGMLVR LTGAWTELLA RRGTERAHPA PVRTLLGEMA AAGVLMQASI 
KFNGALVLQI SGDGPVKLAV AEVQPDLALR ATATVVGDVP AGARLEALVN VGGRGHCAIT 
LDPKDRYPGQ QPYQGVVPLH GDRREPLQQL SEVLEHYMLQ SEQLDTKLVL AANDDVAAGL 
LIQRLPVEGE GNLGARNEDE IGLNEAYNRI AHLSATLTRE ELLTLDADTL LRRLFWEETV 
RRFEPLTGEH GPRFACSCSR ERVARMLRGL GREEFDGLIA ERGLAEVGCE FCGAQYHFDA 
VDGGEVFTAP RDQPPASRAV Q