Gene Anae109_1472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_1472
Symbol	groEL
ID	5375113
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	+
Start bp	1669870
End bp	1671513
Gene Length	1644 bp
Protein Length	547 aa
Translation table	11
GC content	68%
IMG OID	640842983
Product	chaperonin GroEL
Protein accession	YP_001378663
Protein GI	153004338
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0166914
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	0.319334
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGCCA AGGAGATCGC ATTCCACCAG GGGGCCCGCG AAGCCATCCT CCGCGGCGTC 
CAAACGCTCG CCGAGGCTGT CGCCGTGACC CTCGGCCCCA AGGGCCGCAA CGTCGTCATC 
GAGAAGAGCT TCGGCTCGCC GACCATCACC AAGGACGGCG TCACGGTCGC GAAGGAGATC 
GAGGTCGAGA ACAAGTTCGA GAACATGGGC GCGCAGATGG TCCGCGAGGT CGCGTCCCAG 
ACCTCGGACA AGGCGGGCGA CGGCACCACC ACCGCCACCG TGCTCGCGCG CGCCCTCTTC 
GAGGAGGGCC TGAAGCTCGT GGCGGCGGGC CACAACCCGA TGGACCTCAA GCGCGGCATC 
GACCGGGCCG TCGAGGTGAT CGTCGCCGAG CTGAAGAAGC TCTCGAAGCC CACGCAGGGG 
AAGAAGGACA TCGCCCAGGT CGGCACCATC TCCGCGAACG GCGACGAGAC GATCGGCAAC 
ATCATCGCCG AGGCGATGGA GAAGGTGGGC AAGGAGGGCG TCATCACGGT CGAGGAGGCG 
AAGGGCCTCG AGACGACGCT CGACGTGGTC GAGGGCATGC AGTTCGACCG CGGCTACTCC 
TCCCCCTACT TCGTCACGAA CCCGGATCGC ATGGAGGCCG TGCTCGAGGA TCCGTTCATC 
CTCATCACCG AGAAGAAGAT CTCGGCGATG GCCGACCTCA TCCCGGTGCT CGAGCAGGTC 
GCCCGCTCCG GCAAGCCGCT CCTCATCGTC GCCGAGGACG TGGAGGGCGA GGCGCTCGCG 
ACGCTCGTCG TGAACAAGCT GCGCGGCACG CTCCACGTGT GCGCGGTGAA GGCGCCCGGC 
TTCGGCGACC GCCGCAAGGA GATGCTGAAG GACATCGCGA CGCTCACCGG CGGCAACGTG 
GTCGCCGAGG AGCTCGGCAT CAAGCTCGAG CAGCTCACCG TGAAGGATCT CGGGCGCGCG 
AAGCGCATCA CGATCGACAA GGAGAACACC ACGATCGTGG ACGGCGAGGG GAAGCGCGAG 
GACATCGAGG CGCGCATCAA GCAGATCCGC GCGCAGATCG AGGAGACCAC GAGCGACTAC 
GATCGCGAGA AGCTGCAGGA GCGGCTCGCG AAGCTCGTGG GCGGCGTCGC CGTGATCAAC 
GTCGGCGCGG CCACCGAGAC CGAGATGAAG GAGAAGAAGG CCCGCGTCGA GGACGCGCTC 
CACGCGACCC GCGCGGCCGT CGAGGAGGGC ATCGTCCCCG GCGGCGGCGT CGCCTACCTC 
CGCGCGCTGC AGGCGCTGAA GAAGCTCGAG GTGCCCGAGG GCGATCAGCG CTTCGGCGTG 
GCGATCGTGC AGAAGGCGCT CGAGTACCCG GCGCGCCGCA TCGCCGAGAA CGCCGGCTGG 
GACGGCGCGG TGGTCGTCTC GAGGATCAAC GACGGCAAGG CGGCCCACGG CTTCAACGCC 
GCGAGCGAGG TGTTCGAGGA TCTCGAGAAG GCGGGAGTCA TCGATCCGAC CAAGGTGTCC 
CGCACCGCGC TCCAGAACGC CGCGTCCGTC GCGAGCCTCC TCCTCACCAC CGAGGCGATG 
GTGGCCGAGA AGCCGAAGAA GAAGGGCGCG CCCGCCGGCG GCGGCATGGG CGGCATGGGC 
GGCATGGACG AGATGGATTA CTGA

Protein sequence

MPAKEIAFHQ GAREAILRGV QTLAEAVAVT LGPKGRNVVI EKSFGSPTIT KDGVTVAKEI 
EVENKFENMG AQMVREVASQ TSDKAGDGTT TATVLARALF EEGLKLVAAG HNPMDLKRGI 
DRAVEVIVAE LKKLSKPTQG KKDIAQVGTI SANGDETIGN IIAEAMEKVG KEGVITVEEA 
KGLETTLDVV EGMQFDRGYS SPYFVTNPDR MEAVLEDPFI LITEKKISAM ADLIPVLEQV 
ARSGKPLLIV AEDVEGEALA TLVVNKLRGT LHVCAVKAPG FGDRRKEMLK DIATLTGGNV 
VAEELGIKLE QLTVKDLGRA KRITIDKENT TIVDGEGKRE DIEARIKQIR AQIEETTSDY 
DREKLQERLA KLVGGVAVIN VGAATETEMK EKKARVEDAL HATRAAVEEG IVPGGGVAYL 
RALQALKKLE VPEGDQRFGV AIVQKALEYP ARRIAENAGW DGAVVVSRIN DGKAAHGFNA 
ASEVFEDLEK AGVIDPTKVS RTALQNAASV ASLLLTTEAM VAEKPKKKGA PAGGGMGGMG 
GMDEMDY