Gene Rpal_2457 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_2457
Symbol	groEL
ID	6410119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	2653092
End bp	2654729
Gene Length	1638 bp
Protein Length	545 aa
Translation table	11
GC content	65%
IMG OID	642712336
Product	chaperonin GroEL
Protein accession	YP_001991446
Protein GI	192290841
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGCTA AAGAAGTCAA ATTCGGCGTC GACGCCCGCG ACCGCATGCT GCGTGGCGTG 
GACATTCTCG CCAATGCCGT GAAGGTCACG CTGGGTCCGA AGGGCCGCAA CGTCGTCCTC 
GACAAGTCGT TCGGCGCGCC GCGCATCACC AAGGACGGCG TCACCGTCGC CAAGGACATC 
GAGCTCGACG ACAAGTTCGA GAACATGGGC GCGCAGATGG TGCGCGAAGT CGCCTCGAAG 
TCGGCCGACG CCGCGGGTGA CGGCACCACC ACCGCGACCG TGCTGGCCCA GGCGATCGTC 
CGCGAAGGCG CCAAGGCGGT TGCCGCCGGC ATGAACCCGA TGGATCTGAA GCGCGGTATC 
GATCTGGCGG TGGAAGCCGT CGTCGCCGAC CTCGTCAAGA ACTCCAAGAA GGTCACCTCG 
AACGACGAGA TTGCCCAGGT CGGCACCATC TCGGCCAACG GTGACGCCGA GATCGGCAAG 
TTCCTCGCCG ACGCGATGAA GAAGGTCGGC AACGAGGGTG TCATCACCGT CGAGGAAGCC 
AAGTCGCTCG AGACCGAACT CGACGTCGTC GAGGGCATGC AGTTCGACCG CGGCTACATC 
TCGCCCTACT TCGTCACCAA CGCCGACAAG ATGCGCGTCG AATTCGACGA CGCCTACATC 
CTGATCAATG AGAAGAAGCT CTCCAACCTC AACGAGCTGC TGCCGCTGCT CGAGGCGGTG 
GTGCAGACCG GCAAGCCGCT GGTGATCGTT GCGGAAGACG TCGAAGGCGA GGCTCTCGCC 
ACCCTCGTCG TCAACCGTCT GCGCGGCGGC CTCAAGGTCG CGGCCGTCAA GGCGCCGGGC 
TTCGGTGATC GCCGCAAGGC CATGCTGCAG GACATCGCGA TCCTGACCGG CGGCCAGGCG 
ATCTCGGAAG ACCTCGGCAT CAAGATGGAG AACGTCACCC TGCAGATGCT GGGTCGCGCC 
AAGAAGGTGA TGATCGACAA GGAAAACACC ACGATCGTCA ACGGCGCCGG CAAGAAGGCC 
GACATCGAGG CCCGCGTCGC ACAGATCAAG GCGCAGATCG AGGAAACCAC CTCGGACTAC 
GACCGCGAGA AGCTGCAGGA GCGTCTGGCC AAGCTCGCCG GCGGCGTCGC GGTGATCCGC 
GTCGGCGGTG CGACCGAGGT CGAGGTGAAG GAGCGCAAGG ATCGCGTTGA TGACGCGATG 
CACGCCACCC GCGCCGCGGT CGAAGAAGGC ATCGTCCCGG GCGGCGGCGT CGCACTGCTG 
CGCGCCTCCG AGCAGCTCAA GGGCCTCAAG ACCAAGAACG ACGACCAGAA GACCGGCGTC 
GAGATCGTGC GCCGCGCCCT CTCCGCTCCG GCCCGCCAGA TCGCCATCAA CGCCGGCGAA 
GATGGCTCGG TGATCGTCGG CAAGGTGCTC GAGAAGGAGC AGTACGCGTT CGGCTTCGAC 
TCGCAGTCGG GCGAATACGG CGACCTGGTC AAGAAGGGCA TCATCGACCC GACCAAGGTG 
GTGCGCACCG CGATCCAGAA CGCCGCCTCG GTGGCCGCGC TGCTGATCAC CACCGAAGCG 
ATGATCGCCG AACTGCCGAA GAAGAACGCC GGCCCCGCAA TGCCCCCGGG CGGCGGCATG 
GGCGGCATGG ACTTCTAA

Protein sequence

MSAKEVKFGV DARDRMLRGV DILANAVKVT LGPKGRNVVL DKSFGAPRIT KDGVTVAKDI 
ELDDKFENMG AQMVREVASK SADAAGDGTT TATVLAQAIV REGAKAVAAG MNPMDLKRGI 
DLAVEAVVAD LVKNSKKVTS NDEIAQVGTI SANGDAEIGK FLADAMKKVG NEGVITVEEA 
KSLETELDVV EGMQFDRGYI SPYFVTNADK MRVEFDDAYI LINEKKLSNL NELLPLLEAV 
VQTGKPLVIV AEDVEGEALA TLVVNRLRGG LKVAAVKAPG FGDRRKAMLQ DIAILTGGQA 
ISEDLGIKME NVTLQMLGRA KKVMIDKENT TIVNGAGKKA DIEARVAQIK AQIEETTSDY 
DREKLQERLA KLAGGVAVIR VGGATEVEVK ERKDRVDDAM HATRAAVEEG IVPGGGVALL 
RASEQLKGLK TKNDDQKTGV EIVRRALSAP ARQIAINAGE DGSVIVGKVL EKEQYAFGFD 
SQSGEYGDLV KKGIIDPTKV VRTAIQNAAS VAALLITTEA MIAELPKKNA GPAMPPGGGM 
GGMDF