Gene Rleg_5038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5038
Symbol	groEL
ID	8007631
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	-
Start bp	423707
End bp	425335
Gene Length	1629 bp
Protein Length	542 aa
Translation table	11
GC content	61%
IMG OID	644821953
Product	chaperonin GroEL
Protein accession	YP_002973213
Protein GI	241113378
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.473372
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGCTA AAGAAATCAA ATTCAGCACC GAAGCCCGCG AGAAGATGCT GCGTGGCGTC 
GACATCCTGG CCAACGCCGT GAAGGCGACC CTCGGCCCGA AAGGCCGCAA CGTCGTGATC 
GAACGATCTT TCGGCGCCCC GCGCATCACC AAGGACGGCG TTTCCGTCGC CAAGGAAATC 
GAACTCGAAG ACAAGTTCGA GAACATGGGC GCCCAGATGG TCCGCGAAGT CGCCTCGAAG 
ACCAGCGACA TCGCCGGCGA CGGCACCACG ACGGCAACGG TACTGGCCCA GGCGATCGTC 
AAGGAGGGCG CCAAGGCGGT TACCTCAGGC ATGAACCCGA TGGACCTGAA ACGCGGCATC 
GATCTTGCGG TCGGCGCCAT CGTTGCGGAA CTGAAGGCCA ATGCCCGAAA GATCTCCAAC 
AATTCCGAAA TCGCCCAGGT CGGCACGATC TCCGCCAATG GCGATGCCGA AATCGGCCGC 
TTTTTGGCGG AAGCCATGGA AAGGGTCGGC AATGATGGCG TCATCACCGT TGAAGAAGCC 
AAGACCGCCG AAACCGAACT CGAAGTCGTC GAAGGCATGC AGTTCGACCG CGGCTATCTC 
AGCCCCTACT TCGTCACCAA TGCCGACAAG ATGCGGGTCG AGTTTGAAGA CCCTTATATC 
CTCATCCATG AGAAGAAGCT CTCGAACCTG CAGTCGATGC TGCCGGTTCT CGAAGCTGTC 
GTCCAATCCA GCAAGCCGCT GCTCATCATC GCTGAAGACG TCGAAGGCGA AGCCCTGGCA 
ACGCTCGTCG TCAACAAGCT GCGCGGCGGC CTGAAGATCG CCGCCGTCAA GGCTCCTGGC 
TTCGGTGACC GCCGCAAGGC CATGCTCGAA GACATCGCCA TCCTGACCGC CGGCACCGTC 
ATCTCCGAAG ATCTCGGCAT CAAGCTCGAA TCCGTCACGC TCGATATGCT CGGCCGGGCC 
AAGAAGGTTT CGATTGAAAA GGAAAACACC ACGATCGTCG ATGGGTCAGG CGCCAAGTCC 
GACATCGAAG GCCGCGTTGC CCAGATCAAG GCCCAGATCG AAGAAACCAC GTCGGACTAT 
GACCGCGAGA AGCTGCAGGA ACGTCTTGCC AAGCTCGCCG GCGGCGTTGC CGTCATCCGT 
GTCGGCGGCT CGACGGAAGT CGAAGTGAAG GAAAAGAAGG ACCGCGTCGA CGACGCGCTT 
CATGCAACCC GCGCTGCCGT TCAGGAAGGC ATTCTGCCTG GTGGCGGCGT GGCGCTGCTG 
CGCGCCGTCA AGGCGCTCGA CAATGTCAAA ACCGCCAATG GCGACCAGCG CGTCGGCGTC 
GACATCGTTC GCCGCGCGGT CGAGGCACCG GCTCGCCAGA TCGCCGAAAA CGCCGGAGCG 
GAAGGCTCGG TCATCGTCGG TAAGCTGCGC GAGAAAAGCG AGTTCTCCTA CGGCTGGAAC 
GCTCAGACGG GCGAATATGG CGACCTCTAT GCGCAGGGCG TCATCGATCC GGCCAAGGTG 
GTTCGCACCG CGCTGCAGGA TGCGGCCTCC ATCGCCGGTC TTCTCGTCAC GACGGAAGCT 
ATGATCGCCG AGAAACCCAA GAAGGACGCG CCACCGCCAA TGCCCGCCGG CCCCGGTATG 
GACTTCTAA

Protein sequence

MAAKEIKFST EAREKMLRGV DILANAVKAT LGPKGRNVVI ERSFGAPRIT KDGVSVAKEI 
ELEDKFENMG AQMVREVASK TSDIAGDGTT TATVLAQAIV KEGAKAVTSG MNPMDLKRGI 
DLAVGAIVAE LKANARKISN NSEIAQVGTI SANGDAEIGR FLAEAMERVG NDGVITVEEA 
KTAETELEVV EGMQFDRGYL SPYFVTNADK MRVEFEDPYI LIHEKKLSNL QSMLPVLEAV 
VQSSKPLLII AEDVEGEALA TLVVNKLRGG LKIAAVKAPG FGDRRKAMLE DIAILTAGTV 
ISEDLGIKLE SVTLDMLGRA KKVSIEKENT TIVDGSGAKS DIEGRVAQIK AQIEETTSDY 
DREKLQERLA KLAGGVAVIR VGGSTEVEVK EKKDRVDDAL HATRAAVQEG ILPGGGVALL 
RAVKALDNVK TANGDQRVGV DIVRRAVEAP ARQIAENAGA EGSVIVGKLR EKSEFSYGWN 
AQTGEYGDLY AQGVIDPAKV VRTALQDAAS IAGLLVTTEA MIAEKPKKDA PPPMPAGPGM 
DF