Gene Cagg_1055 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1055
Symbol
ID	7268507
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1306168
End bp	1307805
Gene Length	1638 bp
Protein Length	545 aa
Translation table	11
GC content	58%
IMG OID	643565900
Product	chaperonin GroEL
Protein accession	YP_002462405
Protein GI	219847972
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAAGC AACTGATCTT CGATCAGCAA GCTCGTACTG CACTCAAACA CGGTATCGAT 
ACACTCGCGC TAGCAGTCAA AACGACGCTC GGTCCACGTG GGCGTAATGT CGCACTCGAT 
AAGAAATGGG GTGCGCCAAC CGTCACCCAC GACGGTGTAA GCGTCGCGAA GGAGATTGAG 
CTGAAGGATC CGTTCGCCAA CCTTGGTGTC CAACTGCTCA AGCAGGCAGC CGTCAAGACC 
AACGATGTTG CCGGTGATGG TACCACCACG GCAACGGTGC TTGCCCAAGC GATTATCAAT 
GAGGGCTTGA AACTGGTCGC TGCCGGCGCC AACCCCATGC TGCTCAAGCG TGGTCTCGAT 
AAAGGTGGTC AAGCACTGGT CGCTCGCATC AAAGAGCAGG CGATCACCCT CAAGACCCGC 
GATGAGATTC GGAACGTCGC GACAATCTCT GCCCAAGATG CCGAGGTTGG TGAGTTACTG 
GCGACCGTGA TGGATAAGAT CGGTCGCGAC GGCGTCGTTA CGGTCGAGGA GGGGAAGAGC 
ACCCATCTCG AGCACGAGCT GGTCGAGGGT ATGCAGTTTG ACCGTGGTTA TATCTCGCCC 
TACTTCATCA CCGACTCGGC TCGCATGGAG GCGGTGCTCG ATGAACCCTA CATCTTGATC 
ACCGACAAGA AGATCAGCTC GATCAAGGAT TTGTTGCCGA TCCTTGAAGC GGTGCTAAGC 
AGCGGCAAGA AGGATCTCCT CGTCATCGCT GAGGATGTTG ATGGTGAGGC TCTGGCGACG 
TTGGTCGTCA ACAAGCTGCG TGGTACCCTT AATGCCCTCG CCGTGAAGGC CCCCGGCTTC 
GGCGACCGGC GCAAGGCGAT GCTGCAAGAT ATTGCGATCC TCACCGGTGG TACCGTCATC 
TCCGAGGAGA TTGGCCGCAA GCTCGAAAGC GCTACTCTGC AAGACCTTGG CCGCGCCCGC 
CGCGTGAAGG CCGACAAGGA TAACACTGTG ATCGTCGAGG GTCACGGTGA CAAGCAAGCC 
ATCCAGGCTC GCATTGCCCA ACTCAAGCAG CAGATCGAGA CTACAACTTC GGATTACGAC 
CGCGAGAAGT TGCAGGAGCG TGTCGCGAAG TTGTCGGGTG GTGTGGCCGT GATCAAGGTC 
GGTGCGCCGA CCGAACCGGC GATGAAAGAG CGCAAAGCCC GCGTCGAAGA TGCGCTCAAC 
GCGACCCGCG CTGCAGTTGA GGAGGGTATC GTTCCCGGTG GTGGTGTCGC ACTTCTCAAC 
GCCATCCCAG CACTCGATAA CGTCACCACT CAGTTTGACG AAGAGCGCAT GGCGCTCAAC 
GTCCTGCGCC GCGCCCTCGA AGAGCCACTC CGCCAGCTCG CAACCAATGC CGGCGAAGAT 
GGTTCGGTGG TGGTTGAGAA CGTGCGCAAC GAGCAGCGGA AGCACAACAA CAACCACTAC 
GGTTACGATG TCATGACCGG TACGTATGTC GATCTCATGC AAGCCGGCAT TATCGACCCG 
GCCAAAGTGG TACGTACCGC GTTGGAGAAC GCAATTAGCG TCGCCGGTAT GGTGCTGACC 
ACCGAGGCGT TGATCGTCGA GGCCCCTGAA CCCAAGAAGA ACAACAACAC GCCACCAATG 
CCGGACGACG ATTTCTAA

Protein sequence

MAKQLIFDQQ ARTALKHGID TLALAVKTTL GPRGRNVALD KKWGAPTVTH DGVSVAKEIE 
LKDPFANLGV QLLKQAAVKT NDVAGDGTTT ATVLAQAIIN EGLKLVAAGA NPMLLKRGLD 
KGGQALVARI KEQAITLKTR DEIRNVATIS AQDAEVGELL ATVMDKIGRD GVVTVEEGKS 
THLEHELVEG MQFDRGYISP YFITDSARME AVLDEPYILI TDKKISSIKD LLPILEAVLS 
SGKKDLLVIA EDVDGEALAT LVVNKLRGTL NALAVKAPGF GDRRKAMLQD IAILTGGTVI 
SEEIGRKLES ATLQDLGRAR RVKADKDNTV IVEGHGDKQA IQARIAQLKQ QIETTTSDYD 
REKLQERVAK LSGGVAVIKV GAPTEPAMKE RKARVEDALN ATRAAVEEGI VPGGGVALLN 
AIPALDNVTT QFDEERMALN VLRRALEEPL RQLATNAGED GSVVVENVRN EQRKHNNNHY 
GYDVMTGTYV DLMQAGIIDP AKVVRTALEN AISVAGMVLT TEALIVEAPE PKKNNNTPPM 
PDDDF