Gene Dret_2176 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_2176
Symbol	groEL
ID	8420027
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	2473141
End bp	2474790
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	59%
IMG OID	645038770
Product	chaperonin GroEL
Protein accession	YP_003199038
Protein GI	258406296
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.901834
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGCGA AGACCATCAA ATTTGGCGTA AAAGCCCGCG AACAGCTGCA ACAGGGTGTG 
GACCAACTGG CTCAGGCCGT AAAGGTCACC CTTGGCCCCA AAGGCCGTAA TGTCGTTATT 
GAAAAGTCCT TCGGTTCCCC CACGATCACC AAGGACGGTG TCACCGTTGC CCGCGAGATC 
GAACTCGAGG ACAAGTTTGA AAATATGGGC GCTCAGATGG TCAAGGAAGT GGCCAGCAAG 
ACCAGCGACG TTGCTGGTGA CGGCACCACC ACCGCCACAA TCCTGGCCCA GAAAATTTTC 
AGCGAAGGCT TGAAGCTTGT TGCCGCCGGC CGGAACCCCA TGGCCATCAA GCGCGGCATC 
GACAAGGCCG TTGAAGCCAT CAACAAAGAA TTGGCCGACT TCGCCAAGCC GACCCGCGAC 
CAGAAAGAGA TCGCCCAGAT CGGCACTATC TCCGCCAACA ACGATCCGAC CATCGGCAAC 
ATCATTGCCG AGGCCATGAA CAAGGTTGGC AAGGAAGGCG TTATCACCGT GGAAGAGGCC 
AAGGGCCTGG ACACCACCCT GGACGTGGTC GAAGGCATGC AGTTCGACCG CGGCTACCTC 
TCCCCCTATT TCGTGACCGA CTCCGAAAAA ATGGTTGCCG AGTTGGAAGA TCCGCTCATC 
CTCATCAATG AGAAGAAGAT CTCCAACATG AAAGACCTCC TGCCCGTGCT GGAGCAGGTG 
GCCAAAATGA ACAAGCCGCT GATGATCATC GCCGAGGAAA TCGAAGGCGA AGCCCTGGCC 
ACCCTCGTGG TCAACAAGCT GCGCGGCACC CTGCAGGTCG CTGCGGTCAA GGCCCCCGGC 
TTTGGCGAAC GCCGTAAGGC CATGCTCCAG GACATCGCCG TTTTGACCGG CGGCAGCGTC 
ATTTCCGAAG ATGTGGGCAC CAAGCTTGAA AATGCCACGG TCAACGACCT CGGCAGCGCC 
AAGCGCATCA ACATCGACAA AGAAAACACC ACCATCGTGG ACGGCGCTGG CTCCTCCGAC 
GACATCAAGG CCCGCATCAA GCAGATCCGC GCTGAGATCG ACGAAACCAC CTCCGATTAC 
GATCGCGAAA AGCTCCAGGA GCGTTTGGCC AAGATCGTCG GCGGTGTGGC CGTGATCAAT 
GTCGGCGCTG CGACCGAAAC CGAAATGAAA GAAAAGAAGG CCCGCGTCGA AGACGCCCTG 
AACGCTACCC GCGCTGCCGT TGAAGAAGGC ATCGTGCCTG GTGGCGGCGT GGCCTTCATC 
CGCACCCAGC ATGCCGCTAA TTCCGTCAAA CCGGCCGACG AAGACGAAAA GGCCGGTGTC 
GATGTGGTCC GCGCCGCTGT GGTCGAACCC CTGCGTCAGA TTTGCGCCAA TGCTGGCTTC 
GAAGGCGCCT TAATCGTGGA AAAAGTCCGC GAGCACAAGG ACGGCTACGG CTTTAACGCC 
GCCACTGGCG AATTCGAAGA CCTGCTCAAG GCCGGTGTCA TTGATCCTAA AAAGGTCTCC 
CGCACCGCCC TGCAGAACGC CGCTTCCGTC GCCTCCCTCT TGCTGACCAC GGAAGCTGCC 
ATTGCCGACA AACCTGAAGA CAAGGACAGC GGTGGCGCTC CTGCCGGTGG CGGTATGCCC 
GGCATGGGCG GCATGGGCGG CATGTACTAA

Protein sequence

MAAKTIKFGV KAREQLQQGV DQLAQAVKVT LGPKGRNVVI EKSFGSPTIT KDGVTVAREI 
ELEDKFENMG AQMVKEVASK TSDVAGDGTT TATILAQKIF SEGLKLVAAG RNPMAIKRGI 
DKAVEAINKE LADFAKPTRD QKEIAQIGTI SANNDPTIGN IIAEAMNKVG KEGVITVEEA 
KGLDTTLDVV EGMQFDRGYL SPYFVTDSEK MVAELEDPLI LINEKKISNM KDLLPVLEQV 
AKMNKPLMII AEEIEGEALA TLVVNKLRGT LQVAAVKAPG FGERRKAMLQ DIAVLTGGSV 
ISEDVGTKLE NATVNDLGSA KRINIDKENT TIVDGAGSSD DIKARIKQIR AEIDETTSDY 
DREKLQERLA KIVGGVAVIN VGAATETEMK EKKARVEDAL NATRAAVEEG IVPGGGVAFI 
RTQHAANSVK PADEDEKAGV DVVRAAVVEP LRQICANAGF EGALIVEKVR EHKDGYGFNA 
ATGEFEDLLK AGVIDPKKVS RTALQNAASV ASLLLTTEAA IADKPEDKDS GGAPAGGGMP 
GMGGMGGMY