Gene Rleg2_0470 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_0470
Symbol	groEL
ID	6979186
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	479990
End bp	481633
Gene Length	1644 bp
Protein Length	547 aa
Translation table	11
GC content	60%
IMG OID	643395183
Product	chaperonin GroEL
Protein accession	YP_002279994
Protein GI	209548077
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCATCTA AAGAAATCAA GTTTGGTCGT ACCGCGCGCG AAAAGATGCT GCGTGGCGTC 
GACATTCTCG CCGATGCAGT CAAGGTAACG CTCGGCCCGA AGGGCCGTAA CGTCATCATC 
GACAAGTCCT TCGGCGCTCC GCGCATCACC AAGGACGGCG TTTCCGTCGC CAAGGAAATC 
GAACTCGAAG ACAAGTTCGA AAACATGGGC GCGCAGATGG TCCGCGAAGT TGCTTCGAAG 
ACCAACGACA TCGCCGGCGA CGGCACCACG ACTGCAACCG TTCTGGCCCA GGCGATCGTT 
CGCGAAGGCA ACAAGGCCGT TGCAGCCGGC ATGAACCCGA TGGACCTGAA GCGCGGTATC 
GACCTCGCTG TGGCCGACGT CGTGAAGGAT CTCCAGGCCA AGGCCAAGAA GATCTCCACC 
TCTGAAGAAG TTGCACAGGT CGGCACGATC TCGGCAAACG GCGACAAGCA GGTCGGTCTC 
GACATTGCCG AAGCCATGCA GAAGGTCGGC AACGAAGGCG TCATCACGGT TGAAGAAGCC 
AAGACCGCCG AAACCGAACT CGAAGTCGTC GAAGGCATGC AGTTCGACCG CGGCTACCTC 
AGCCCCTACT TCGTGACCAA CCCGGAAAAG ATGATTGCCG ACCTCGAAGA CGTCTTCATT 
CTCCTTCACG AGAAGAAGCT CTCGAACCTG CAGTCGATGC TCCCTGTTCT CGAAGCTGTC 
GTCCAGACCG GCAAGCCGCT CCTGATCATC GCTGAAGACG TTGAAGGCGA AGCTCTTGCG 
ACGCTCGTCG TCAACAAGCT GCGCGGCGGC CTCAAGATCG CTGCTGTCAA GGCGCCTGGC 
TTCGGCGACC GCCGCAAGGC CATGCTCGAA GACATCGCCA TCCTGACCGG CGGCACCGTG 
ATCTCCGAAG ACCTCGGCAT CAAGCTCGAA TCCGTCACGC TCGACATGCT CGGCCGTGCG 
AAGAAGGTTT CGATCTCCAA GGAAAACACC ACGATCGTCG ACGGTTCGGG CGCCAAGTCC 
GACATCGAAG GCCGTGTTGC CCAGATCAAG GCCCAGATCG AAGAAACCAC CTCCGACTAC 
GACCGCGAGA AGCTGCAGGA ACGCCTTGCC AAGCTCGCTG GCGGCGTTGC CGTCATCCGC 
GTCGGCGGCT CGACGGAAGT CGAAGTGAAG GAAAAGAAGG ACCGCATCGA CGACGCCCTC 
AACGCGACGC GCGCTGCCGT TCAGGAAGGC ATCGTCCCCG GCGGCGGTAT CGCTCTCCTG 
CGCTCCTCCA CGAAGATCAC CGTCAAGGGT GCAAACGACG ACCAGGAAGC CGGCATCAAC 
ATCGTTCGCC GCGCCCTGCA GTCGCTCGTT CGTCAGATCG CTGAAAACGC AGGCGACGAA 
GCCTCGATCG TTGTCGGCAA GGTCCTCGAC AAGAATGAAG ACAACTACGG CTACAACGCC 
CAGACGTCCG AATTCGGCGA CATGATCGCC ATGGGTATCG TCGACCCGCT CAAGGTCGTT 
CGCACGGCAC TGCAGAACGC TGCTTCTGTT GCATCGCTGC TGATCACCAC CGAAGCCATG 
ATCGCCGAAC TGCCGAAGAA AGAATCGGCT GGCGGCGGCA TGCCGGGCGG CATGGGCGGC 
ATGGGCGGAA TGGACATGAT GTGA

Protein sequence

MASKEIKFGR TAREKMLRGV DILADAVKVT LGPKGRNVII DKSFGAPRIT KDGVSVAKEI 
ELEDKFENMG AQMVREVASK TNDIAGDGTT TATVLAQAIV REGNKAVAAG MNPMDLKRGI 
DLAVADVVKD LQAKAKKIST SEEVAQVGTI SANGDKQVGL DIAEAMQKVG NEGVITVEEA 
KTAETELEVV EGMQFDRGYL SPYFVTNPEK MIADLEDVFI LLHEKKLSNL QSMLPVLEAV 
VQTGKPLLII AEDVEGEALA TLVVNKLRGG LKIAAVKAPG FGDRRKAMLE DIAILTGGTV 
ISEDLGIKLE SVTLDMLGRA KKVSISKENT TIVDGSGAKS DIEGRVAQIK AQIEETTSDY 
DREKLQERLA KLAGGVAVIR VGGSTEVEVK EKKDRIDDAL NATRAAVQEG IVPGGGIALL 
RSSTKITVKG ANDDQEAGIN IVRRALQSLV RQIAENAGDE ASIVVGKVLD KNEDNYGYNA 
QTSEFGDMIA MGIVDPLKVV RTALQNAASV ASLLITTEAM IAELPKKESA GGGMPGGMGG 
MGGMDMM