Gene Francci3_0633 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0633
Symbol	groEL
ID	3903311
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	715686
End bp	717326
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	69%
IMG OID	637877966
Product	chaperonin GroEL
Protein accession	YP_479746
Protein GI	86739346
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGAAGA TTCTGACGTT CAACGAGGAC GCCCGCCGCG CGCTCGAGCA CGGGGTGAAC 
GCCCTGGCCA ACGCGGTCAA GGTGACGATC GGCCCGCGTG GTCGCAATGT CGTCATCGAC 
AAGCACTACG GCGCCGCGAC GATCACCAAT GACGGGGTGA CGATCGCGCG CGAGATCGAG 
CTGGAGGACC CCTACGAGAA CCTGGGCGCC CAGCTCGCGA AGGAAGTCGC CACCAAGACC 
AACGACGTGG CTGGCGACGG CACCACGACG GCGACCGTGC TAGCCCAGGA GATGGTGCGC 
TTCGGTCTCA AGCAGGTGAC CGCGGGGGCC GCCCCACTGA CGCTGAAGCT GGGCATCGAG 
GCCGCCGTCG AGGCCGTCTC CGCGGCACTG CTGAAGCAGG CCATCGAGGT CAACTCGAAG 
GAGACCATCG CCCAGGTCGC CGCCATCTCC GCTCAGGACC CGCAGGTCGG GGAACTGATC 
GCCGAGGCGA TCGACAAGAT CGGCAAGGAC GGCGTCATCA CGGTCGAGGA GAGCCAGACC 
CTCGGGCTGG ACCTTGAACT GACCGAGGGC ATGCAGTTCG ACAAGGGCTA CATCTCGCCG 
TACTTCGTCA CGGACGCCGA GGCCCAGGAG GCCGTGCTCG AGGACGCCTA CGTCCTGCTC 
TACCCGGGCA AGATCTCGGC GCTGAACGAG ATCCTGCCCG TGCTGGAGCA GGTCGTCCAG 
GAGCGCAAGC CGCTACTGAT TATCGCCGAG GAGGTCGAGG GCGAGGCCCT GTCCACCCTG 
GTGGTGAACT CGATCCGCAA GACCTTCCAG GTCGTCGCGG TCAAGGCTCC CGGGTTTGGG 
GACCGCCGCA AGGCACTGCT GCAGGATATC GCCGTGCTCA CCGGCGGCCA GGTGGTGGCC 
TCGGAGGTCG GTCTTTCCCT CGACGCGGTG ACGTTGGCCG ACCTGGGCCG GGCCCGGCGG 
GTCGTGGTGG ACAAGGACAA CACCACCATC GTTGACGGGG TTGGCGAGGC CTCCTCGATC 
GCCGATCGGG TGCGTCAGCT CAAGCAGGAG ATCGAGGTCA GCGACTCCGA CTGGGACCGC 
GAGAAGCTGC AGGAGCGGTT GGCCAAGCTC GCCGGTGGGG TCGCGGTCAT CCGCGTCGGC 
GCCGCCACCG AGGTGGAGCT CAAGGAGAGG AAGCACCGCC TCGAGGACGC CGTGTCGGCT 
ACCCGCGCGG CCATCGAGGA GGGCATCATC GCCGGCGGCG GTTCCGCGCT CACCCACGTG 
GCGTCCGTGC TCGATGACGG GCTCGGTCGC ACCGGGGACG AGCTCGCCGG GGTGCGGATC 
GTGCGCCGCG CGCTCGACGC CCCGCTGTCG TGGATCGCGC GCAACGCTGG TCTGGAGGGC 
GCGGTCATCG TCTCCAAGGT CAAGGAGCTC GAGCCGGGTC GTGGGTACAA CGCGGCCACC 
GGCGAGTACA CCGATCTGAT CGCGGCCGGC GTCATCGACC CGGTCAAGGT CACCCGGTCG 
GCGGTGGCGA ACGCCGCCTC GATCGCGGCT CTGCTCATCA CCACCGAGGG CCTGGTCGTC 
GAGAAGCCGG CGGAGCCCGC TCCCCAGGAC GGCCACGGCC ACGGCCACGG GCACAGCCAC 
CCGCAGGGCC CGGGTTTCTG A

Protein sequence

MPKILTFNED ARRALEHGVN ALANAVKVTI GPRGRNVVID KHYGAATITN DGVTIAREIE 
LEDPYENLGA QLAKEVATKT NDVAGDGTTT ATVLAQEMVR FGLKQVTAGA APLTLKLGIE 
AAVEAVSAAL LKQAIEVNSK ETIAQVAAIS AQDPQVGELI AEAIDKIGKD GVITVEESQT 
LGLDLELTEG MQFDKGYISP YFVTDAEAQE AVLEDAYVLL YPGKISALNE ILPVLEQVVQ 
ERKPLLIIAE EVEGEALSTL VVNSIRKTFQ VVAVKAPGFG DRRKALLQDI AVLTGGQVVA 
SEVGLSLDAV TLADLGRARR VVVDKDNTTI VDGVGEASSI ADRVRQLKQE IEVSDSDWDR 
EKLQERLAKL AGGVAVIRVG AATEVELKER KHRLEDAVSA TRAAIEEGII AGGGSALTHV 
ASVLDDGLGR TGDELAGVRI VRRALDAPLS WIARNAGLEG AVIVSKVKEL EPGRGYNAAT 
GEYTDLIAAG VIDPVKVTRS AVANAASIAA LLITTEGLVV EKPAEPAPQD GHGHGHGHSH 
PQGPGF