Gene Athe_2137 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2137
Symbol	groEL
ID	7408846
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2271512
End bp	2273131
Gene Length	1620 bp
Protein Length	539 aa
Translation table	11
GC content	41%
IMG OID	643716502
Product	chaperonin GroEL
Protein accession	YP_002573985
Protein GI	222530103
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.817524
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGCAA AGATGATATT ATTTGACGAA GAGGCAAGAA GGGCTTTAGA GCGTGGTGTT 
AACAAGCTTG CAGATACAGT TAAAGTAACA CTTGGGCCAA AAGGAAGAAA CGTTGTTCTT 
GAAAAGAAAT TTGGTTCACC ACAGATTGTA AATGACGGTG TTACAATTGC AAAAGAGATA 
GAGCTTGAAG ACCCATTTGA AAACATGGGT GCACAGATTG TAAGAGAGGT TGCATCCAAG 
ACAAACGACA TTGCAGGTGA TGGTACAACA ACTGCAACAG TTCTGGCACA GGCAATGATA 
AGAGAAGGTC TTAAGAACAT TGCAGCTGGT GCAAACCCAA TGATTTTAAG GAAAGGTATC 
CAGAAAGCAG TTGATGTTGT TGTAGAAGAA ATTAGAAAAA TGAGCAAGAA GGTAAGAGGA 
AAAGAAGACA TCACATATGT TGCTTCAATC TCAGCAGGTG ACGAAGAGAT TGGCAAACTT 
GTTGCAGATG CAATGGAGAA AGTAACAAAT GACGGTGTTA TCACTGTTGA AGAGTCAAAG 
ACAACAGAGA CAACTCTTGA GATAGTTGAA GGTATGCAGT TTGACAGAGG TTACATCTCT 
GCATACATGG TAACAGACAC AGAGAGAATG GAAGCGGTAC TTGACGACCC GTACATCTTG 
ATTACAGATA AGAAAATCTC AACAATCCAA GACATTCTGC CGCTTCTTGA ACAGATAGTT 
CAGCAGGGAA GAAAACTTTT GATAATTGCT GAAGATGTTG AAGGCGAAGC ATTGGCAACA 
CTTGTAGTAA ACAAGCTCAG AGGAACACTC CAGTGCGTTG CGGTAAAAGC ACCAGGATTT 
GGTGACAGAA GAAAAGCAAT GCTTCAAGAC ATTGCAATAT TAACTGGTGG TCAAGTAATT 
TCTGAAGAGC TTGGTCTTGA CTTAAGAGAG GTAAAACTCA GCCAGCTTGG TCGTGCAAGA 
CAAGTAAAAG TTCAGAAAGA AAATACAATT ATTGTTGACG GTGCAGGCGA CCCAAGCGAA 
ATCAAGGCGA GAATTCAGTC AATCAAAAAG CAGATTGAAG AGACAACATC TGACTTTGAC 
AGAGAAAAAC TTCAGGAAAG ACTTGCAAAA CTTGCTGGTG GTGTTGCAGT AATTCATGTT 
GGTGCTGCAA CTGAGACTGA ACTTAAAGAA AAGAAACTCA GAATTGAAGA TGCTCTTGCT 
GCAACAAAGG CTGCAGTAGA AGAAGGAATT GTACCTGGCG GTGGTACAGC TTTAATTAAT 
GCAATTCCAG CCCTTGATAA GCTTATTGAA AGCCTCACTG GCGATGAAAA GACAGGTGCA 
ATGATTGTAA GAAAAGCTTT GGAAGAGCCA CTCAGACAAA TTGCTGAAAA CGCAGGTTTA 
GATGGTTCAG TTATTGTTAA CAAAGTAAAA GAAAGCCCAG CTGGTGTTGG ATTTGACGCA 
CTCAACGAGA GATTTGTTGA CATGTTCGAG GCAGGTATTG TTGACCCAAC AAAGGTTACA 
AGAACGGCTA TTCAGAACGC TGCATCGGCT GCTGCTATGC TTCTGACAAC AGAAGCAGTT 
GTTGCTGAAA AACCTGAAAA GGAAAAGAAT CCACCAGCTC CAGCACCTGA TATGTATTAA

Protein sequence

MAAKMILFDE EARRALERGV NKLADTVKVT LGPKGRNVVL EKKFGSPQIV NDGVTIAKEI 
ELEDPFENMG AQIVREVASK TNDIAGDGTT TATVLAQAMI REGLKNIAAG ANPMILRKGI 
QKAVDVVVEE IRKMSKKVRG KEDITYVASI SAGDEEIGKL VADAMEKVTN DGVITVEESK 
TTETTLEIVE GMQFDRGYIS AYMVTDTERM EAVLDDPYIL ITDKKISTIQ DILPLLEQIV 
QQGRKLLIIA EDVEGEALAT LVVNKLRGTL QCVAVKAPGF GDRRKAMLQD IAILTGGQVI 
SEELGLDLRE VKLSQLGRAR QVKVQKENTI IVDGAGDPSE IKARIQSIKK QIEETTSDFD 
REKLQERLAK LAGGVAVIHV GAATETELKE KKLRIEDALA ATKAAVEEGI VPGGGTALIN 
AIPALDKLIE SLTGDEKTGA MIVRKALEEP LRQIAENAGL DGSVIVNKVK ESPAGVGFDA 
LNERFVDMFE AGIVDPTKVT RTAIQNAASA AAMLLTTEAV VAEKPEKEKN PPAPAPDMY