Gene Franean1_0175 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0175
Symbol	groEL
ID	5668600
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	211645
End bp	213267
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	68%
IMG OID	641239104
Product	chaperonin GroEL
Protein accession	YP_001504548
Protein GI	158312040
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0553371
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGAAGA TCATTGCCTT CGACGAGGAG GCACGGCGCG GCCTGGAGCG CGGCATGAAC 
CAGCTGGCCG ACGCGGTCAA GGTCACGCTC GGCCCCAAGG GTCGCAACGT CGTGCTGGAG 
AAGAAGTGGG GCGTCCCCAC GATCACCAAC GACGGCGTCA GCATCGCCAA GGAGATCGAG 
CTCGAGGACC CGTACGAGAA GATCGGCGCG GAGCTCGTCA AGGAAGTCGC GAAGAAGACC 
AACGACGTCG CGGGTGACGG CACCACCACC GCGACCATTC TCGCCCAGGC TCTGGTGCGC 
GAGGGCCTGC GCAACGTCGC CGCCGGCGCG AACCCGATGG GCCTGAAGAA GGGCATCGAG 
GCCGCCGTCG AGCGTGTCTC CGAGGAGCTC TCCAGCGTCG CCAAGGACGT GGAGACCAAG 
GAGCAGATCG CCTCCACCGC CTCCATCTCC GCCGGTGACC CGGCCATCGG CAGCATGATC 
GCCGAGGCGA TGGACAAGGT CGGCAAGGAA GGCGTCATCA CCGTCGAGGA GAGCAACACC 
TTCGGGCTCG AGCTCGAGCT CACCGAGGGC ATGCGCTTCG ACAAGGGCTA CATCTCGCCC 
TACTTCGTCA CCGACACCGA CCGCATGGAA GCTGTCCTCG ACGACCCGTA CATCCTGATC 
GCGAACAGCA AGATCTCCGC GGTCAAGGAC CTCCTCCCGA TCCTGGAGAA GGTCATGCAG 
GCCGGCAAGC CGCTGGCCAT CATCTCCGAG GACGTCGAGG GCGAGGCCCT GGCCACCCTG 
GTCGTCAACA AGATCCGCGG CACGTTCAAG AGCACCGCGG TCAAGGCGCC GGGCTTCGGT 
GACCGCCGCA AGGCCATGCT GACCGACATC GCCGTCCTCA CCGGCGGCCA GGTCATCTCC 
GAGGACGTCG GCCTCAAGCT CGAGGGCACC ACCGTCGACC TGCTCGGCCG GGCCCGCAAG 
GTCGTCATCA CCAAGGACGA GACCACCATC GTCGAGGGTG CCGGCGACGC GGACCAGATC 
GCGGGGCGGG TCAACCAGAT CCGCAACGAG ATCGAGAAGT CCGACTCCGA CTACGACCGC 
GAGAAGCTCC AGGAGCGGCT GGCCAAGCTC GCCGGCGGCG TCGCGGTCAT CAAGGTCGGC 
GCGGCCACCG AGGTCGAGCT CAAGGAGAAG AAGCACCGCA TCGAGGACGC CGTCTCGAAC 
GCGAAGGCCG CGGTCGAGGA GGGCATCGTC GCCGGCGGTG GCGTCGCGCT CCTGCAGGCC 
GCGACCAGCG CCTTCGAGAA GCTCGACCTC TCCGGCGACG AGGCCACCGG TGCGAACATC 
GTCCGTCTCG CCCTGGAGGC GCCGATCAAG CAGATCGCGT TCAACAGCGG TCTCGAGGGC 
GGCGTCGTGG TCGAGAAGGT GCGCAACCTC CCGACCGGGC ACGGCCTGAA CGCGGCGACC 
GGCGAGTACG TCGACATGGT CGCCACCGGG ATCATCGACC CGGCGAAGGT CACCCGCTCG 
GCGCTGCAGA ACGCCGCGTC GATCGCCGGC CTCTTCCTCA CCACCGAGGC CGTCATCGCG 
GACAAGCCGG AGAAGGACAA GGCCCCGGCC ATGCCGGGTG GCGGCGGCGA GATGGACTTC 
TGA

Protein sequence

MPKIIAFDEE ARRGLERGMN QLADAVKVTL GPKGRNVVLE KKWGVPTITN DGVSIAKEIE 
LEDPYEKIGA ELVKEVAKKT NDVAGDGTTT ATILAQALVR EGLRNVAAGA NPMGLKKGIE 
AAVERVSEEL SSVAKDVETK EQIASTASIS AGDPAIGSMI AEAMDKVGKE GVITVEESNT 
FGLELELTEG MRFDKGYISP YFVTDTDRME AVLDDPYILI ANSKISAVKD LLPILEKVMQ 
AGKPLAIISE DVEGEALATL VVNKIRGTFK STAVKAPGFG DRRKAMLTDI AVLTGGQVIS 
EDVGLKLEGT TVDLLGRARK VVITKDETTI VEGAGDADQI AGRVNQIRNE IEKSDSDYDR 
EKLQERLAKL AGGVAVIKVG AATEVELKEK KHRIEDAVSN AKAAVEEGIV AGGGVALLQA 
ATSAFEKLDL SGDEATGANI VRLALEAPIK QIAFNSGLEG GVVVEKVRNL PTGHGLNAAT 
GEYVDMVATG IIDPAKVTRS ALQNAASIAG LFLTTEAVIA DKPEKDKAPA MPGGGGEMDF