Gene Francci3_2513 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2513
Symbol	groEL
ID	3904657
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2969278
End bp	2970927
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	67%
IMG OID	637879843
Product	chaperonin GroEL
Protein accession	YP_481609
Protein GI	86741209
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.167914
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAAGG ATCTGCGGTT CAATGTCGAG GCGCGCCGCC TGCTGGAGGC CGGGGTCAAT 
GCCCTGGCGG ACGCCGTCAA GGTGACTCTG GGTCCAAAGG GCCGCAACGC CGTCATCGAA 
AAACTGACCG GGCCGCCCAC CATCACCAAT GACGGTGTGA CCATAGCCAG GGAGATCCAG 
CTGCGTAACC CCTTCGCCAA CATGGGGGCG CAACTGGTCA AGGAGGTCGC GACCAAGACC 
AACGGCACTG CCGGCGACGG AACCACCACC GCCACCGTGC TCGCGCAGGC CCTCGTCCGG 
GAGGGTCTGC ATGCCGTGGA CGGGGGCGCC AACCCGATGT TTCTCAAGAA CGGCATCGAG 
GCTGCCGTGG CCGCCCTGCT AGAGGAGTTT GAAAAGTACC GGGGAGAGGT CGAGGGCGAG 
GCCGATCTTG CCCGGGTGGC GACCCTCGCC GCCAACAACG ATGCCCGGAT CGGCGACGTC 
GTGGCCGCGG CCCTTGGCCG GGTCGGCTGC GACGGGGTGG TCACGGTCGA GGAATCCCCG 
ATCTTCGGAC TCGAGGTCAG CTTCGTGGAC GGTATCGAGT TGGACAACGG GTACCTCTCG 
CCGTACATGG TCACCGACAC CGAGCGGATG GAGGCCGCCT ACACCGACCC CTACATCCTG 
TTGACCAACG AGAAGATCTC TCAGGTTCAG ACCCTGATGC CGGTCCTCGA GCTGGTCACC 
CGGGCCGGCG GCCAGTTGAT CGTCTTCGCG GAGAACGTCG AGGGACCGGC ACTGGGCATG 
CTGGTCGCCA ACAATGTGCA CGGGACCTTC CGGTCCGCGG TGGTCCGGGC ACCCGGTTTC 
GGTCACCGTC GGTTGGCCGA GCTCAACGAT CTCGCGGTTT TTCTGGGCGG TCAGGTGATT 
ACCGCGGATG CCGGGCTTTC CCTGGACCGG GTCACCCTCG GCCAGCTCGG GCGTTGCAAG 
AAGGCCACCA TTACCGAGCA TGCGACTACG ATCGTCGACG GCGCCGGTTC CGCCACCGAG 
ATCCATGCCC GGATCGACCA GCTCAAGCGG GAGCTTGAAC GGGCGGAGAA CCCCCACGAC 
CAGGACACGT TGCAGACCCG GATCGCCCGG TTGTCCGGCG GCGTCGCGGT GATCCGGGTC 
GGCGCCGTGA CCGGTGTGGA GTTGAAGGAG AAGCTGCACC GGGTCGAGGA CTCCCTCGCG 
GCGGCACGGG CTGCTCTCGC CGAAGGTGTC GTGGCGGGCG GTGGTACCGC ACTGCTGCAA 
GCGGCCTCGG CCCTTGACAA GCTCACGCTG ACCGGCGACG CCGCCGAAGG CAGGGAGATC 
GTTCGGCGGG CCATCGCCGA ACCACTGCGC TGGATCGCGA TCAACGCCGG CTACGACGGC 
GACGAAGTGG TCAAGCGGGT CGCCGAGCTG CCGCGCGGTC ACGGTTTCAA CGCCGCGACC 
GGAGAATACG GGGAGATGGC CGGCTTCGGT GTCATCGACC CGGTGAAAGT TACCCGTTGC 
GCGCTGCAGA GCGCGGCGTC GATCGCCGCG CTGTTGCTGA CAACGGAAAC CCTGGTTGTC 
GAGGAGGTCA TCGGCAACCC GGGTGCCGTG ATCGCTCCCG GATTCGGGGA TCTCGCGGAG 
GGCCTGGTCC GGCCTTCCAA CATCGCCTGA

Protein sequence

MAKDLRFNVE ARRLLEAGVN ALADAVKVTL GPKGRNAVIE KLTGPPTITN DGVTIAREIQ 
LRNPFANMGA QLVKEVATKT NGTAGDGTTT ATVLAQALVR EGLHAVDGGA NPMFLKNGIE 
AAVAALLEEF EKYRGEVEGE ADLARVATLA ANNDARIGDV VAAALGRVGC DGVVTVEESP 
IFGLEVSFVD GIELDNGYLS PYMVTDTERM EAAYTDPYIL LTNEKISQVQ TLMPVLELVT 
RAGGQLIVFA ENVEGPALGM LVANNVHGTF RSAVVRAPGF GHRRLAELND LAVFLGGQVI 
TADAGLSLDR VTLGQLGRCK KATITEHATT IVDGAGSATE IHARIDQLKR ELERAENPHD 
QDTLQTRIAR LSGGVAVIRV GAVTGVELKE KLHRVEDSLA AARAALAEGV VAGGGTALLQ 
AASALDKLTL TGDAAEGREI VRRAIAEPLR WIAINAGYDG DEVVKRVAEL PRGHGFNAAT 
GEYGEMAGFG VIDPVKVTRC ALQSAASIAA LLLTTETLVV EEVIGNPGAV IAPGFGDLAE 
GLVRPSNIA