Gene Rleg_5849 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5849
Symbol	groEL
ID	8016484
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012853
Strand	+
Start bp	416980
End bp	418608
Gene Length	1629 bp
Protein Length	542 aa
Translation table	11
GC content	61%
IMG OID	644827979
Product	chaperonin GroEL
Protein accession	YP_002979179
Protein GI	241518551
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.471391
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGCGA AAGAAGTCAA ATTCAATACC GATGCCCGTG AACGCATGTT GCGTGGGGTC 
GACGTTCTGG CAAACGCCGT GAAGGTTACG CTCGGCCCGA AGGGACGCAA CGTCGTGATC 
GACAAATCGT TCGGAGCGCC CCGGATTACC AAGGACGGAG TATCCGTCGC CAAGGAAATC 
GAGCTGGAAG ACAAGTTCGA GAATATGGGC GCCCAGATGC TGCGCGAGGT GGCGTCGAAG 
ACCAATGACC TTGCTGGCGA TGGCACCACG ACGGCGACCG TCCTTGCCCA GGCCATTGTC 
AAGGAAGGTG CAAAGGCTGT CGCCTCAGGC ATGAACCCGA TGGACCTGAA GCGTGGCATC 
GACATTGCCG TAGACGCCGT TGTCAAGGAA CTGAAGGCGA ACGCCCGCAA GATCACCAGC 
AATTCGGAAA TCGCCCAAGT GGGCACCATT TCGGCCAATG GCGACGAGGA AATCGGCAGG 
TATCTCGCCG AAGCGATGGA AAAGGTCGGC AACGAAGGTG TGATCACCGT CGAGGAAGCC 
AAGACCGCAG AGACAGAGCT GGAAGTCGTC GAAGGCATGC AGTTCGACCG TGGTTATCTC 
AGCCCGTACT TCGTCACCAA CCAGGACAAG ATGCGGGTCG AGCTCGAAGA GCCCTACATC 
CTCATTCACG AGAAGAAGCT CTCCAATCTG CAGGCGATGC TTCCAGTCCT GGAAGCCGTG 
GTGAAGTCCG GCAAGCCTCT GCTGATCATT GCCGAGGACG TGGAAGGCGA AGCCCTTGCG 
ACCCTCGTCG TTAACAAGCT TCGCGGCGGT CTGAAGATCG CCGCCGTCAA GGCCCCGGGC 
TTCGGCGACC GCCGCAAGGC CATGTTGGAA GACATTGCCA TCCTCACGGG CGGTACCGTG 
ATCTCCGAAG ACGTCGGCAT CAAGCTGGAG AACGTGACAC TCAACATGCT TGGCCGCGCC 
AAGACGGTCT CGATCGAGAA GGAAAACACC ACCATCATCG ATGGCGTCGG CTCCAAGGCG 
GAGATCGATG GACGGGTCGC CCAGATCCGC GCTCAGATCG AGGAAACCAC CTCCGACTAC 
GACCGTGAGA AGCTGCAGGA GCGCCTCGCC AAACTCGCCG GCGGCGTTGC CGTCATCCGC 
GTCGGAGGCT CGACCGAGGT CGAGGTCAAG GAGAAGAAGG ACCGTGTCGA CGATGCGCTG 
CATGCGACAC GTGCTGCCGT CGAAGAAGGT ATTCTGCCCG GTGGCGGTGT CGCCCTGCTG 
CGTGCGGTCA AGGCGCTCGA CGGTCTTCCG ACGGCCAACG ACGATCAGCG CGTCGGGATC 
GACATCGTCC GTCGGGCGAT CGAGGCGCCG GTGCGTCAGA TCGCCGAAAA TGCTGGCGCC 
GAAGGTTCGA TCGTCGTCGG CAAGCTGCGC GAAAAGTCGG AGTTGTCCTT CGGCTGGAAC 
GCCCAGACCG GCGAGTATGG CGATTTATAC GCGCAGGGCG TGATCGACCC TGCGAAGGTG 
GTGCGCACCG CGCTTCAGGA TGCGGCCTCG GTCGCGGGTC TGTTGGTCAC AACTGAGGCG 
ATGATCGCCG AAAAGCCGAA GAAGGATGCC GCCCCCGCCC TGCCCGCTGG GGCCGGCATG 
GACTTCTAA

Protein sequence

MAAKEVKFNT DARERMLRGV DVLANAVKVT LGPKGRNVVI DKSFGAPRIT KDGVSVAKEI 
ELEDKFENMG AQMLREVASK TNDLAGDGTT TATVLAQAIV KEGAKAVASG MNPMDLKRGI 
DIAVDAVVKE LKANARKITS NSEIAQVGTI SANGDEEIGR YLAEAMEKVG NEGVITVEEA 
KTAETELEVV EGMQFDRGYL SPYFVTNQDK MRVELEEPYI LIHEKKLSNL QAMLPVLEAV 
VKSGKPLLII AEDVEGEALA TLVVNKLRGG LKIAAVKAPG FGDRRKAMLE DIAILTGGTV 
ISEDVGIKLE NVTLNMLGRA KTVSIEKENT TIIDGVGSKA EIDGRVAQIR AQIEETTSDY 
DREKLQERLA KLAGGVAVIR VGGSTEVEVK EKKDRVDDAL HATRAAVEEG ILPGGGVALL 
RAVKALDGLP TANDDQRVGI DIVRRAIEAP VRQIAENAGA EGSIVVGKLR EKSELSFGWN 
AQTGEYGDLY AQGVIDPAKV VRTALQDAAS VAGLLVTTEA MIAEKPKKDA APALPAGAGM 
DF