Gene Mext_3334 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_3334
Symbol
ID	5832866
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	3695529
End bp	3697151
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	67%
IMG OID	641369134
Product	chaperonin GroEL
Protein accession	YP_001640792
Protein GI	163852749
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGCCA AGGACGTGAA ATTCTCGGGT GATGCGCGCG AGCGCCTGTT GCGCGGCGTC 
GATATTCTGG CGGATGCCGT GAAGGTGACG TTGGGGCCGA AGGGCCGCAA CGTCGTGATC 
GAGAAGAGTT TCGGGGCGCC GCGCATCACC AAGGACGGCG TCACCGTCGC CAAGGAGATC 
GAGTTGGAGG ACCGCTTCGA GAATCTCGGC GCCCAACTCC TGCGCGAAGT CGCCTCGAAG 
ACCAACGATC TGGCCGGCGA CGGCACCACA ACCGCGACCG TGCTCGCCCA GGCGATCGTC 
CGCGAGGGCG CCAAGGCGGT GGCGGCGAAC TTCAACCCGC TCGACTTGAA GCGCGGCATC 
GACCTCGCCA CCGCCGCCGC CGTGAAGGAC ATCACCGGAC GCGCCCGCAA GGTGACCGCC 
TCCGACGCCA TCGCTCAAGT CGGCACAATC TCCGCCAACG GCGACGCCGA GATCGGCCGC 
CTCATCGCCG AGGCCGTCGA GCGGGTCGGC AAGGAAGGCG TCATTACGGT GGAGGAGGCC 
AAGACCGCCG AGACCGAACT CGATGTCGTC GAGGGCCTGC AGTTCGACCG CGGCTACCTC 
TCGCCGTACT TCGTGACGAA TACGGAAAAG CTGATTGCCG AACTCGAGGA TCCCTACATC 
CTGATCCACG AGAAGAAGCT CTCCTCGCTG CAGCCGCTGC TGCCGGTGCT GGAGGCGGTC 
GTCCAGTCGA GCCGTCCCCT GCTCATCATC GCCGAGGATG TGGAGGGCGA GGCGCTCGCC 
ACCCTCGTCG TGAACAAGCT GCGCGGCGGC CTCAAGATCG CGGCAGTGAA GGCTCCGGGC 
TTCGGCGACC GTCGCAAGGC GATTCTTGAG GACATCGCGA TCCTCACGAA CGGCCAGACC 
ATCTCCGAGG ATCTCGGGAT CAAGCTCGAG AACGTGTCGC TTCCCCTGCT GGGTCAGGCC 
AAGCGGGTGC GCATCGACAA GGAGAGCACC ACGATTGTCG ACGGAGCGGG GGACAGGGCG 
CAGATCGACG CGCGCGTCGC CCAGATCAAG GCGCAGATCG AGGAGACCAC CTCGGACTAC 
GACCGCGAGA AGCTCCAGGA GCGCTTGGCC AAGCTCGCGG GCGGCGTCGC GGTGATCCGC 
GTCGGCGGCG CGACCGAGGT CGAGGTCAAG GAGAAGAAGG ACCGGGTGGA CGACGCGCTC 
AACGCCACCC GCGCCGCGAT CGAGGAAGGC ATCGTTCCGG GCGGCGGCAC CGCGCTCCTG 
CGGGCCAAGG CCGCCGTATT AGCGCTCAAG AGCGAGAATG CCGATGTGAA GGCCGGCATC 
AACATCGTGC TCAAGGCGCT CGAAGCGCCG ATCCGGCAGA TCGCGGCCAA TGCCGGGGTC 
GAGGGCTCGA TCGTCGTGTC GAAGGTGATC GAGAACGGCT CGGAAACCTT CGGATTCGAC 
GCCCAGACCG AGACCTACGT CGACCTGATC GAGGCCGGCA TCGTCGATCC GGCCAAGGTT 
GTGCGCACGG CACTGCAGGA CGCGGCCTCG GTCGCCGGCC TGCTGGTGAC GACGGAGGCG 
TTGATCGCCG AGCGGCCGAA GGAGAAGGCG CCGCCACTGC CGCCCGGCGG GCCGGACTTC 
TGA

Protein sequence

MAAKDVKFSG DARERLLRGV DILADAVKVT LGPKGRNVVI EKSFGAPRIT KDGVTVAKEI 
ELEDRFENLG AQLLREVASK TNDLAGDGTT TATVLAQAIV REGAKAVAAN FNPLDLKRGI 
DLATAAAVKD ITGRARKVTA SDAIAQVGTI SANGDAEIGR LIAEAVERVG KEGVITVEEA 
KTAETELDVV EGLQFDRGYL SPYFVTNTEK LIAELEDPYI LIHEKKLSSL QPLLPVLEAV 
VQSSRPLLII AEDVEGEALA TLVVNKLRGG LKIAAVKAPG FGDRRKAILE DIAILTNGQT 
ISEDLGIKLE NVSLPLLGQA KRVRIDKEST TIVDGAGDRA QIDARVAQIK AQIEETTSDY 
DREKLQERLA KLAGGVAVIR VGGATEVEVK EKKDRVDDAL NATRAAIEEG IVPGGGTALL 
RAKAAVLALK SENADVKAGI NIVLKALEAP IRQIAANAGV EGSIVVSKVI ENGSETFGFD 
AQTETYVDLI EAGIVDPAKV VRTALQDAAS VAGLLVTTEA LIAERPKEKA PPLPPGGPDF