Gene Francci3_4398 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_4398
Symbol	groEL
ID	3907373
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	5256902
End bp	5258524
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	67%
IMG OID	637881729
Product	chaperonin GroEL
Protein accession	YP_483473
Protein GI	86743073
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.600466
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGAAGA TCATTGCCTT CGACGAGGAG GCTCGGCGCG GCCTGGAGCG CGGCATGAAC 
CAGCTGGCCG ATGCGGTCAA GGTCACGCTC GGGCCGAAGG GCCGCAACGT CGTGCTGGAG 
AAGAAGTGGG GCGTCCCCAC GATCACCAAC GATGGTGTGA GCATCGCCAA GGAGATCGAG 
CTCGAGGACC CGTACGAGAA GATCGGCGCG GAACTCGTCA AGGAAGTCGC GAAGAAGACC 
AACGACGTCG CGGGTGACGG CACCACCACC GCCACCATCC TGGCCCAGGC CCTGGTGCGC 
GAGGGTCTGC GCAACGTGGC CGCCGGCGCC AACCCCCTCG GGCTGAAGAA GGGCATCGAG 
GTCGCGGTCG AGCGCGTCTC CGAGGAGCTG TCCAAGCAGG CCAAGGAGGT CGAGACCAAG 
GAGCAGATCG CCTCCACGGC GTCCATCTCC GCGGGTGACT CGGCCATCGG CGGCCTCATC 
GCCGAGGCGC TCGACAAGGT CGGCAAGGAA GGCGTCGTCA CCGTCGAGGA GAGCAACACC 
TTCGGCCTCG AGCTCGAGCT CACCGAGGGT ATGCGCTTCG ACAAGGGCTA CATCTCGCCG 
TACTTCGTCA CGGACGCGGA CCGTCAGGAA GCCGTCCTGG ACGACCCGTA CATCCTGATC 
GTCAACAGCA AGATCTCCGC GGTCAAGGAC CTGCTCCCGC TGCTGGAGAA GGTCATGCAG 
ACCGGTAAGC CGCTGGCGAT CATCGCCGAA GATGTCGAGG GCGAGGCGCT GGCCACCCTG 
GTCGTCAACA AGATCCGCGG CACCTTCAAG AGCGCCGCGG TGAAGGCCCC CGGCTTCGGT 
GACCGCCGCA AGGCGATCCT GGGCGACATC GCCATCCTGA CCGGTGGTCA GGTCATCTCC 
GAGGACGTCG GCCTCAAGCT CGAGAGCACC TCGCTCGACC TGCTCGGCCG TGCCCGGAAG 
ATTGTCGTTA CCAAGGACGA GACGACCGTC GTCGAGGGTG CCGGCGACCC CGACCAGATC 
GCCGGTCGGG TCAGCCAGAT CCGCAACGAG ATCGAGAAGT CGGACTCGGA CTACGACCGC 
GAGAAGCTCC AGGAGCGGCT CGCGAAGCTG GCTGGCGGCG TCGCCGTCAT CAAGGTCGGC 
GCGGCCACCG AGGTCGAGCT CAAGGAGAAG AAGCACCGCA TCGAGGACGC GGTGTCCAAC 
GCGAAGGCCG CTGTCGAGGA GGGCATCGTC GCCGGTGGCG GCGTCGCGCT GCTCCAGGCG 
TCGATCACTG CCTTCGAGAA GTTGGACCTG TCCGGCGACG AGGCGACCGG TGCCAACATC 
GTCCGGCTCG CGCTCGAGGC GCCCATCAAG CAGATCGCCT TCAACAGCGG TCTCGAGGGC 
GGCGTCGTGG TCGAGAAGGT CCGCAACCTG CCGACCGGCC ACGGCCTGAA CGCGGCCACC 
GGCGAGTACG TCGACCTGAT CGGCACCGGC ATCATCGACC CGGCCAAGGT CACCCGCTCC 
GCCCTGCAGA ACGCCGCGTC GATCGCCGGC CTGTTCCTCA CCACCGAGGC CGTCATCGCC 
GACAAGCCGG AGAAGAACCC GGCCCCGGCA GTCCCGGGCG GCGGCGGCGA CATGGACTTC 
TAG

Protein sequence

MPKIIAFDEE ARRGLERGMN QLADAVKVTL GPKGRNVVLE KKWGVPTITN DGVSIAKEIE 
LEDPYEKIGA ELVKEVAKKT NDVAGDGTTT ATILAQALVR EGLRNVAAGA NPLGLKKGIE 
VAVERVSEEL SKQAKEVETK EQIASTASIS AGDSAIGGLI AEALDKVGKE GVVTVEESNT 
FGLELELTEG MRFDKGYISP YFVTDADRQE AVLDDPYILI VNSKISAVKD LLPLLEKVMQ 
TGKPLAIIAE DVEGEALATL VVNKIRGTFK SAAVKAPGFG DRRKAILGDI AILTGGQVIS 
EDVGLKLEST SLDLLGRARK IVVTKDETTV VEGAGDPDQI AGRVSQIRNE IEKSDSDYDR 
EKLQERLAKL AGGVAVIKVG AATEVELKEK KHRIEDAVSN AKAAVEEGIV AGGGVALLQA 
SITAFEKLDL SGDEATGANI VRLALEAPIK QIAFNSGLEG GVVVEKVRNL PTGHGLNAAT 
GEYVDLIGTG IIDPAKVTRS ALQNAASIAG LFLTTEAVIA DKPEKNPAPA VPGGGGDMDF