Gene Rsph17025_2645 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_2645
Symbol
ID	5085069
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	-
Start bp	2686155
End bp	2687144
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	68%
IMG OID	640484208
Product	Hsp33 protein
Protein accession	YP_001168837
Protein GI	146278678
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1281] Disulfide bond chaperones of the HSP33 family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0673391
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.801183
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATCG GTTCACAGAT CGCCTGGGAC GACACCGTCC TGCCCTTCCA GCTTGACCGC 
TCGGACATCC GCGGCCGTGT GGTGCGGCTG GATGGCGTGC TCGAGGAAGT GCTGTCGAAG 
CATGATTATC CGCCGCAGAT CGAGGCGCTG GTGGCCGAGG CGTCGCTGCT GACCGCGCTG 
ATCGGGCAGG CCATCAAGCT GCGCTGGAAA CTGTCGCTGC AGATCCGCGG CAATGGGGCG 
GTGCGGATGA TTGCCACCGA CTATTACAGC CCTCCGGAAG ATGGCGAGCC CGCGCGGATC 
CGTGCCTATG CGAGCTATGT CGCCGAGGAT CTGGCCCCCG GCGCCGCCGC CTTCGACCAG 
CTGGGTGAGG GCTATTTTGC CATCCTGATC GATCAGGGGC AGGGGATGGT GCCCTATCAG 
GGCATCACTC CGATCGCGGG CGGGTCGTTG ACCGCCTGCG CCGAGACCTA TTTCGCCCAG 
TCCGAGCAGC TTCCCACCCG CTTCGCCCTG TCCTTCGGCC AGTCCACGGC CAACGGCGCG 
ACTCACTGGC GGGGCGGCGG CGTGATGCTT CAGCACATGC CCAAGGCCTC GCCCGGCGTG 
GCGGGCGAGG GCGGATCGGG CGAGGGCGGG CTTCTGCAGC ACCACGACCT GCTCGAGGGC 
GACGAGGGCG AGAACTGGAC GCGCGCGAAC CTGCTGCTCG ACACGGTCGA GGATCTCGAA 
CTGGTGGGTC CGTCGGTTCA GCCGCCGGAC CTGCTCGTGC GGCTGTTCCA CGAAGAGGAA 
CCGCGCGTGT TCGAGGCGCA GACCCTGCGC TTTGGCTGCT CCTGTTCGGC GGATCGGGTG 
CGCGAGTCGC TGTCGATCTA CGCGCCCGAG GAGATCGCCG AGATGACGAC GGATGAGGGC 
ATCCTTACCG CCGACTGCCA GTTCTGCGGC GCGCATTACG AGTTCGACCC CGCGACGCTG 
GGGACCGGCG CAGGGAGCGG CGATGCCTGA

Protein sequence

MTIGSQIAWD DTVLPFQLDR SDIRGRVVRL DGVLEEVLSK HDYPPQIEAL VAEASLLTAL 
IGQAIKLRWK LSLQIRGNGA VRMIATDYYS PPEDGEPARI RAYASYVAED LAPGAAAFDQ 
LGEGYFAILI DQGQGMVPYQ GITPIAGGSL TACAETYFAQ SEQLPTRFAL SFGQSTANGA 
THWRGGGVML QHMPKASPGV AGEGGSGEGG LLQHHDLLEG DEGENWTRAN LLLDTVEDLE 
LVGPSVQPPD LLVRLFHEEE PRVFEAQTLR FGCSCSADRV RESLSIYAPE EIAEMTTDEG 
ILTADCQFCG AHYEFDPATL GTGAGSGDA