Gene Franean1_3353 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3353
Symbol	groEL
ID	5671724
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	3968525
End bp	3970153
Gene Length	1629 bp
Protein Length	542 aa
Translation table	11
GC content	68%
IMG OID	641242241
Product	chaperonin GroEL
Protein accession	YP_001507661
Protein GI	158315153
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGAAGA TCATTGCCTT CGACGAGGAG GCACGGCGCG GCCTGGAGCG CGGCATGAAC 
CAGCTGGCCG ACGCGGTCAA GGTCACGCTC GGCCCCAAGG GTCGCAACGT CGTCCTCGAG 
AGCAGGTTCG GCGTCCCCAC GATCACCAAC GACGGCGTGA GCATCGCCCG GGAGATCGAG 
CTCGAGGACC CGTACGAGAA GATCGGCGCG GAGCTCGTCA AGGAAGTCGC GAAGAAGACC 
AACGACGTCG CGGGTGACGG CACCACCACC GCGACCATTC TCGCCCAGGC TCTCATCCGC 
GAGGGCCTGC GTAACGTCGC CGCCGGTGCG AACCCGATCG CTCTGAAGAA GGGCATCGAA 
ACCGCCGCTG CAGCCGTCTG CGCGGAGCTC TCCAGCGTCG CGAAGGACGT GGAGACCAAG 
GAGCAGATCG CCTCGGCCGC CTCCATCTCC GCCGGTGACC CTGCCATCGG CGCCATGATC 
GCCGAGGCGA TGGACAAGGT CGGCAAGGAA GGCGTCATCA CCGTCGAGGA GAGCAACACC 
TTCGGGCTCG AGCTCGAGCT CACCGAGGGC ATGCGCTTCG ACAAGGGCTA CATCTCGCCC 
TACTTCGTCA CCGACACCGA CCGCATGGAA GCCGTCCTCG ACGACCCGTA CATCCTGATC 
ACCAACAGCA AGATCTCCGC GGTCAAGGAC CTCCTCCCGA TCCTGGAGAA GGTCATGCAG 
GCCGGCAAGC CGCTGGCCAT CATCTCCGAG GACGTCGAGG GCGAGGCCCT GGCCACCCTG 
GTCGTCAACA AGATCCGCGG CACGTTCAAG AGCACCGCGG TCAAGGCGCC GGGCTTCGGT 
GACCGCCGCA AGGCCATGCT GACCGACATC GCCGTCCTCA CCGGCGGCCA GGTCATCTCC 
GAGGACATCG GCCTCAAGCT CGAGGGCACC ACCGTCGACC TGCTCGGCCG GGCCCGCAAG 
GTCGTCATCA CCAAGGACGA GACCACCATC GTCGAGGGTG CCGGCGACGC GGACCAGATC 
GCGGGGCGGG TCAACCAGAT CCGCGCGGAA CTCGACCGGG CGGACACCGA CTTCGACCGC 
GAGAAGCTCC AGGAGCGGCT GGCCAAGCTC GCCGGCGGCG TCGCGGTCAT CAAGGTCGGC 
GCGGCCACCG AGGTCGAGCT CAAGGAGAAG AAGCACCGCA TCGAGGACGC CGTCTCGAAC 
GCGAAGGCCG CGGTCGAGGA GGGCATCGTC GCCGGCGGTG GCGTCGCGCT CCTGCAGGCC 
TCCACCAGCG CCTTCGAGAA GCTCGACCTC TCCGGTGACG AGGCCACCGG CGCCCTGATC 
GTCGAGCGCG CGCTCGCCGC ACCGCTGCAT CAGATCGCCG CCAACGCCGG TCTCGAGGGC 
GGCGTCGTGG TCGAGAAGGT CCGCGGTCTC CCGACCGGGC ACGGCCTGAA CGCCGCCACC 
GGCGAGTACG TCGACATGAT CGCCGCCGGG ATCATCGACC CGGTGAAGGT CACCCGCTCG 
GCGCTGCAGA ACGCCGCGTC CATCACCGGC CTCTTCCTCA CCATCGAGGT CGTGGTGGCG 
AACAGCCTGG CGGACGCGGC GGCGTCCGCG TCCGCGGATG CCGCCGCCTT CGGCGACATG 
GGTATGTAA

Protein sequence

MPKIIAFDEE ARRGLERGMN QLADAVKVTL GPKGRNVVLE SRFGVPTITN DGVSIAREIE 
LEDPYEKIGA ELVKEVAKKT NDVAGDGTTT ATILAQALIR EGLRNVAAGA NPIALKKGIE 
TAAAAVCAEL SSVAKDVETK EQIASAASIS AGDPAIGAMI AEAMDKVGKE GVITVEESNT 
FGLELELTEG MRFDKGYISP YFVTDTDRME AVLDDPYILI TNSKISAVKD LLPILEKVMQ 
AGKPLAIISE DVEGEALATL VVNKIRGTFK STAVKAPGFG DRRKAMLTDI AVLTGGQVIS 
EDIGLKLEGT TVDLLGRARK VVITKDETTI VEGAGDADQI AGRVNQIRAE LDRADTDFDR 
EKLQERLAKL AGGVAVIKVG AATEVELKEK KHRIEDAVSN AKAAVEEGIV AGGGVALLQA 
STSAFEKLDL SGDEATGALI VERALAAPLH QIAANAGLEG GVVVEKVRGL PTGHGLNAAT 
GEYVDMIAAG IIDPVKVTRS ALQNAASITG LFLTIEVVVA NSLADAAASA SADAAAFGDM 
GM