Gene RPD_2227 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_2227
Symbol	groEL
ID	4022712
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	2491839
End bp	2493482
Gene Length	1644 bp
Protein Length	547 aa
Translation table	11
GC content	65%
IMG OID	637962422
Product	chaperonin GroEL
Protein accession	YP_569363
Protein GI	91976704
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.182713
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.929536
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGCTA AAGAAGTGAA ATTCGGCGTC GACGCCCGCG ACCGCATGAT GCGCGGCGTG 
GACATTCTCG CCAATGCGGT GAAGGTCACG CTCGGCCCGA AGGGCCGCAA CGTCGTGCTC 
GACAAGTCGT TCGGCGCTCC GCGTATCACC AAGGACGGCG TCACCGTCGC CAAGGAGATC 
GAGCTCGACG ACAAGTTCGA GAACATGGGC GCGCAGATGG TGCGCGAAGT CGCCTCGAAG 
TCGGCCGACG CCGCCGGTGA CGGCACCACC ACCGCGACCG TACTGGCCCA GGCGATCGTC 
CGCGAAGGCG GCAAGGCCGT CGCCGCCGGC ATGAACCCGA TGGATCTGAA GCGTGGCATC 
GACCTCGCGG TCGAAGCGGT CGTCGCGGAT CTCGTCAAGA ACTCCAAGAA GGTCACCTCG 
AACGAGGAGA TCGCCCAGGT CGGCACGATT TCGGCCAATG GCGACGTCGA GATCGGCAAG 
TTCCTGTCGG ACGCGATGAA GAAGGTCGGC AACGAGGGTG TCATCACCGT CGAGGAAGCC 
AAGTCGCTCG AGACCGAACT CGACGTCGTC GAGGGCATGC AGTTCGATCG CGGCTACATC 
TCGCCCTACT TCGTCACCAA CGCCGACAAG ATGCGCGTTG AATTCGACGA CGCCTACATC 
CTGATCAACG AGAAGAAGCT CTCCAACCTC AACGAGCTGC TGCCGCTGCT CGAAGCCGTC 
GTCCAGACCG GCAAGCCGCT GGTGATCGTC GCTGAGGACG TCGAAGGCGA AGCGCTCGCC 
ACCCTCGTCG TCAACCGCCT GCGCGGCGGC CTCAAGGTCG CGGCCGTCAA GGCTCCGGGC 
TTCGGCGATC GCCGCAAGGC CATGCTGCAG GACATCGCGA TCCTGACCGG CGGCCAGGCG 
ATCTCGGAAG ACCTCGGCAT CAAGATGGAG AACGTCACGC TCCAGATGCT CGGCAAGGCC 
AAGAAGGTGA TGATCGACAA GGAAAACACC ACGATCGTCA ACGGCGCCGG CAAGAAGGCC 
GACATCGAAG CCCGCGTCGC GCAGATCAAG GCGCAGATCG AGGAAACCAC CTCGGACTAC 
GACCGCGAGA AGCTGCAGGA GCGTCTGGCC AAGCTCGCCG GCGGCGTCGC GGTGATCCGC 
GTCGGCGGCG CGACCGAGAT CGAAGTGAAG GAGCGCAAGG ATCGCGTTGA TGACGCGATG 
CACGCCACCC GCGCTGCGGT CGAGGAAGGC ATCGTCCCGG GCGGCGGCGT CGCTCTGCTG 
CGCGCCTCCG AGCAGCTCAA GCGCATCAAG ACCCAGAACG ACGACCAGAA GACCGGCGTC 
GAGATCGTGC GCAAGGCGCT CTCCGCCCCG GCCCGCCAGA TCGCCATCAA CGCCGGCGAA 
GACGGCTCGG TGATCGTCGG CAAGGTGCTC GAGAAGGACC AGTACAACTA CGGCTTCGAC 
AGCCAGACTG GCGAATACGG CGACCTGGTC AAGAAGGGCA TCATCGACCC GACCAAGGTG 
GTCCGCACCG CGATCCAGAA CGCAGCCTCC GTTGCCGCGC TGCTGATCAC CACCGAAGCG 
ATGGTGGCCG AGCTGCCGAA GAAGGGTGGC GCTGCCGGTG GCATGCCCCC GGGCGGCGGC 
GGCATGGGCG GCATGGACTT CTGA

Protein sequence

MSAKEVKFGV DARDRMMRGV DILANAVKVT LGPKGRNVVL DKSFGAPRIT KDGVTVAKEI 
ELDDKFENMG AQMVREVASK SADAAGDGTT TATVLAQAIV REGGKAVAAG MNPMDLKRGI 
DLAVEAVVAD LVKNSKKVTS NEEIAQVGTI SANGDVEIGK FLSDAMKKVG NEGVITVEEA 
KSLETELDVV EGMQFDRGYI SPYFVTNADK MRVEFDDAYI LINEKKLSNL NELLPLLEAV 
VQTGKPLVIV AEDVEGEALA TLVVNRLRGG LKVAAVKAPG FGDRRKAMLQ DIAILTGGQA 
ISEDLGIKME NVTLQMLGKA KKVMIDKENT TIVNGAGKKA DIEARVAQIK AQIEETTSDY 
DREKLQERLA KLAGGVAVIR VGGATEIEVK ERKDRVDDAM HATRAAVEEG IVPGGGVALL 
RASEQLKRIK TQNDDQKTGV EIVRKALSAP ARQIAINAGE DGSVIVGKVL EKDQYNYGFD 
SQTGEYGDLV KKGIIDPTKV VRTAIQNAAS VAALLITTEA MVAELPKKGG AAGGMPPGGG 
GMGGMDF