Gene Rleg_0515 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_0515
Symbol	groEL
ID	8011710
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	535298
End bp	536941
Gene Length	1644 bp
Protein Length	547 aa
Translation table	11
GC content	60%
IMG OID	644823106
Product	chaperonin GroEL
Protein accession	YP_002974359
Protein GI	241203263
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.128762
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCATCTA AAGAAATCAA GTTTGGCCGC ACCGCGCGCG AAAAGATGCT GCGCGGCGTC 
GACATTCTCG CCGATGCAGT GAAGGTCACG CTCGGCCCGA AGGGCCGTAA CGTCATCATC 
GACAAGTCCT TCGGCGCGCC GCGCATCACC AAGGACGGCG TTTCCGTCGC CAAGGAAATC 
GAACTCGAAG ACAAGTTCGA AAACATGGGC GCCCAGATGG TCCGCGAAGT TGCTTCGAAG 
ACCAACGACA TCGCCGGCGA CGGCACCACG ACGGCTACCG TTCTTGCCCA GGCGATCGTT 
CGCGAAGGCA ACAAGGCCGT TGCAGCCGGC ATGAACCCGA TGGACCTGAA GCGCGGCATC 
GACCTTGCTG TTGCCGACGT CGTGAAGGAT CTCCAGGCCA AGGCCAAGAA GATCTCGACT 
TCGGAAGAAG TTGCACAGGT CGGCACGATT TCGGCCAATG GCGACAAGCA GGTCGGTCTC 
GACATTGCTG AAGCCATGCA GAAGGTCGGC AACGAAGGCG TCATCACGGT TGAAGAAGCC 
AAGACCGCCG AAACCGAACT CGAAGTCGTC GAAGGCATGC AGTTCGACCG CGGCTACCTC 
AGCCCCTACT TCGTGACCAA TCCGGAAAAG ATGATCGCCG ACCTCGAAGA CGTCTTCATT 
CTCCTTCACG AGAAGAAGCT CTCGAACCTG CAGTCGATGC TCCCGGTTCT CGAAGCCGTC 
GTTCAGACCG GCAAGCCGCT CCTCATCGTC GCTGAAGACG TCGAAGGCGA AGCCCTCGCT 
ACGCTCGTCG TCAACAAGCT GCGCGGCGGC CTGAAGATTG CTGCCGTCAA GGCACCTGGC 
TTCGGCGATC GCCGCAAGGC CATGCTCGAA GACATCGCCA TCCTGACGGG CGGCACTGTC 
ATCTCCGAAG ATCTCGGCAT CAAGCTCGAA TCCGTCACGC TCGACATGCT CGGCCGTGCC 
AAGAAGGTTT CGATCTCCAA GGAAAACACC ACGATCGTCG ACGGTTCGGG CGCTAAGACC 
GACATCGAAG GCCGTGTTGC CCAGATCAAG GCCCAGATCG AAGAAACCAC CTCCGACTAC 
GACCGCGAGA AGCTGCAGGA ACGTCTTGCC AAGCTCGCTG GCGGCGTTGC CGTCATCCGC 
GTCGGCGGCT CGACGGAAGT CGAAGTGAAG GAAAAGAAGG ACCGCATCGA CGACGCGCTC 
AACGCGACCC GCGCTGCCGT TCAGGAAGGT ATCGTCCCCG GCGGCGGTAT CGCTCTGCTC 
CGCTCCTCCA CGAAGATCAC CGTCAAGGGT GCAAACGACG ACCAGGAAGC CGGCATCAAC 
ATCGTTCGCC GCGCCCTGCA GTCGCTCGTT CGTCAGATCG CTGAAAACGC AGGCGACGAA 
GCCTCGATCG TTGTCGGCAA GGTCCTCGAC AAGAACGAAG ACAACTACGG CTACAACGCC 
CAGACGTCCG AATATGGCGA CATGATCGCC ATGGGTATCG TCGACCCGCT CAAGGTCGTT 
CGCACGGCGC TGCAGAACGC TGCTTCTGTC GCATCGCTGC TGATCACCAC CGAAGCCATG 
ATTGCCGAAC TGCCGAAGAA AGAATCGGCT GGCGGCGGCA TGCCGGGCGG AATGGGCGGA 
ATGGGCGGAA TGGACATGAT GTGA

Protein sequence

MASKEIKFGR TAREKMLRGV DILADAVKVT LGPKGRNVII DKSFGAPRIT KDGVSVAKEI 
ELEDKFENMG AQMVREVASK TNDIAGDGTT TATVLAQAIV REGNKAVAAG MNPMDLKRGI 
DLAVADVVKD LQAKAKKIST SEEVAQVGTI SANGDKQVGL DIAEAMQKVG NEGVITVEEA 
KTAETELEVV EGMQFDRGYL SPYFVTNPEK MIADLEDVFI LLHEKKLSNL QSMLPVLEAV 
VQTGKPLLIV AEDVEGEALA TLVVNKLRGG LKIAAVKAPG FGDRRKAMLE DIAILTGGTV 
ISEDLGIKLE SVTLDMLGRA KKVSISKENT TIVDGSGAKT DIEGRVAQIK AQIEETTSDY 
DREKLQERLA KLAGGVAVIR VGGSTEVEVK EKKDRIDDAL NATRAAVQEG IVPGGGIALL 
RSSTKITVKG ANDDQEAGIN IVRRALQSLV RQIAENAGDE ASIVVGKVLD KNEDNYGYNA 
QTSEYGDMIA MGIVDPLKVV RTALQNAASV ASLLITTEAM IAELPKKESA GGGMPGGMGG 
MGGMDMM