Gene Hoch_6589 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_6589
Symbol
ID	8549006
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	9040275
End bp	9041939
Gene Length	1665 bp
Protein Length	554 aa
Translation table	11
GC content	66%
IMG OID	646391249
Product	chaperonin GroEL
Protein accession	YP_003270948
Protein GI	262199739
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.931782
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGGTA AAGAGATTAT TTTCGAAGAG AACGCTCGCA ACAAAGTGAT GCGCGGTGTC 
GATACCCTGG CGAATGCCGT GAAAGTGACC CTCGGCCCCC GTGGTCGCAA CGTGGTCATT 
GAGAAGTCGT GGGGCGCCCC CACGGTGACC AAGGACGGCG TCACCGTCGC CAAGGAGATC 
GAGCTCGAGA ACAAGTTCGA GAACATGGGC GCGCAGATGG TCAAGGAGGT CGCCTCCAAG 
ACCTCTGACA ACGCCGGTGA TGGCACCACC ACCGCCACCG TGCTGGCGCA GGCCATCTTC 
CGTGAGGGCA GCAAGCTGGT CGCCGCGGGT CACAATCCGA TGGAGATCAA GCGCGGCATC 
GACGCCGCCG TCGAGAGCAT CGTCGCCTCG CTCGGTGAGC TCGCCACCTC GACCAAGGAT 
CACAAGGAGA TCGCTCAGGT CGGCACCATC AGCGCCAACG GCGACGCCAC CATCGGCGAC 
ATGATCGCCG AGGCCATGGA GAAGGTCGGC AAAGAGGGCG TGATCACGGT CGAAGAGTCC 
AAGACCATGC AGAGCGAGCT CGACGTGGTC GAGGGCATGC AGTTCGACCG CGGCTACCTG 
TCGCCGTACT TCGTGACCGA CTCGGAGCGC ATGGAGGTCG TGCTCGAGGA TGCGCTGGTG 
CTCATCCACG AGAAGAAGAT CTCGAACATG AAGGATCTCC TGCCGGTGCT CGAGCAGGTG 
GCCAAGCAGG GTCGTCCGCT GCTCATCGTC GCCGAGGACG TCGACGGTGA GGCGCTGGCC 
ACCCTGGTGG TGAACAAGCT GCGCGGCACC CTCCACGTGT GCGCGGTCAA GGCCCCGGGC 
TTTGGCGACC GCCGCAAGGA GATGCTCAAG GACATCGCGG TGCTCACCGG CGGCACGGCC 
GTCACCGATG ACCTCGGCCT CAAGCTCGAG AACATCACGG TCAACGACCT CGGCATCGCC 
AAGCGCGTCA CGGTGGACAA GGACAACACC ACCATCGTCG ACGGCGCCGG CAAGAAAGAG 
GACATCGACG CCCGCGTCAA GCAGATCCGC ATCCAGGTCG AGGAGACCAG CAGCGACTAC 
GATCGCGAGA AGCTGCAGGA GCGCCTGGCC AAGCTGGTCG GCGGTGTCGC CGTCATCCGC 
GTGGGTGCGG CCACCGAGGT CGAGATGAAG GAGAAGAAGG CGCGCGTGGA AGACGCCATG 
CACGCCACCC GCGCGGCCGT CGAAGAGGGC ATCGTCCCCG GCGGCGGTGT GGCCCTGCTG 
CGCTGCCTCA AGGGTCTCGA CAGCCTCAAT CTGGGCGAGG AGCAGAAGTT CGGCGTCTCG 
ATCGTGCGTC GCGCGCTCGA GGAGCCGCTG CGCCAGATCT CGGCCAACGC CGGTTCGGAC 
GGCTCGATCG TGGTCGAGAA GGTCAAGAAC GGCGAGGGCG CGTTCGGCTT CAACGCCGCC 
AAGGGCGAGT TCGAGGACCT GCTCAAGGCC GGCGTCATCG ACCCCGCCAA GGTGGTTCGC 
ACCGCGCTGC AGAACGCGGC TTCGGTGAGC GGCCTGCTGC TCACGACCGA GGCTCTCATC 
GCCGAGAAGC CCAAGAAAGA GACCGCGCCG GCCGGTGGTC ACGACCACGG CGGCATGGGC 
GGCATGGGCG GCATGGGCGG CATGGGCGGC ATGGGCGGCT TCTGA

Protein sequence

MAGKEIIFEE NARNKVMRGV DTLANAVKVT LGPRGRNVVI EKSWGAPTVT KDGVTVAKEI 
ELENKFENMG AQMVKEVASK TSDNAGDGTT TATVLAQAIF REGSKLVAAG HNPMEIKRGI 
DAAVESIVAS LGELATSTKD HKEIAQVGTI SANGDATIGD MIAEAMEKVG KEGVITVEES 
KTMQSELDVV EGMQFDRGYL SPYFVTDSER MEVVLEDALV LIHEKKISNM KDLLPVLEQV 
AKQGRPLLIV AEDVDGEALA TLVVNKLRGT LHVCAVKAPG FGDRRKEMLK DIAVLTGGTA 
VTDDLGLKLE NITVNDLGIA KRVTVDKDNT TIVDGAGKKE DIDARVKQIR IQVEETSSDY 
DREKLQERLA KLVGGVAVIR VGAATEVEMK EKKARVEDAM HATRAAVEEG IVPGGGVALL 
RCLKGLDSLN LGEEQKFGVS IVRRALEEPL RQISANAGSD GSIVVEKVKN GEGAFGFNAA 
KGEFEDLLKA GVIDPAKVVR TALQNAASVS GLLLTTEALI AEKPKKETAP AGGHDHGGMG 
GMGGMGGMGG MGGF