Gene Hoch_5367 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5367
Symbol
ID	8547779
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	7381629
End bp	7383245
Gene Length	1617 bp
Protein Length	538 aa
Translation table	11
GC content	67%
IMG OID	646390040
Product	chaperonin GroEL
Protein accession	YP_003269744
Protein GI	262198535
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.475271
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.589855
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGCCA AAGAAATCGT ATTTTCCACC CAGGCCCGCG CGGAGATCGC CAAGGGTCTG 
AACATGCTCG CCAACGCAGT GAAGGTCACG CTTGGGCCCC GCGGTCGCAA CGTCGTGATC 
GAGAAGTCCT GGGGCGCCCC GACGGTGACC AAGGACGGCG TGACCGTGGC CAAAGAGGTC 
GAGGTCACCA ACAAGCTCCA GAACATGGGC GCGCAGATGA TGAAGGAGGT CGCTTCCAAG 
ACCTCCGACA TCGCCGGTGA CGGCACCACC ACCGCCACCG TGCTGGCGCA GGCCATCTTC 
ACCGAGGGCG CCAAGCTGGT CGCCGCCGGC GTCAACCCGA TGGACCTCAA GCGCGGCATC 
GAGGCCGCGG TCGAGGAGAT CGTCGACGAG CTGTCCAAGC TCTCGACCCC GACCAAGGGC 
AAGACCGACA TCGCCCAGGT CGGCACCATC AGCGCCAACG GCGACTCGAC CATCGGCGAC 
ATGATCGCCG AGGCCATGGA GAAGGTCGGC AAAGAGGGTG TGATCACGGT CGAGGAGTCC 
AAGACCATGC AGAGCGAGCT CGACGTGGTC GAGGGCATGC AGTTCGATCG CGGCTACCTC 
TCGCCGTACT TCGTGACCGA CCCCGATCGC ATGGAGGTCG TGCTCAACGA CCCCTTCCTG 
CTCATCTGCG AGAAGAAGAT CTCCAACATG AAGGATCTGC TTCCCGTGCT CGAGCAGGTG 
GCCAAGTCGG GCCGTCCGCT GCTCATCCTC GCCGAGGACG TCGATGGCGA GGCGCTGGCC 
ACCCTGGTGG TCAACAAGCT GCGCGGCACC CTGCAGGTGG CCGCGGTCAA GGCCCCGGGC 
TTCGGTGACC GCCGCAAGGC CATGCTCACC GACATCGCCA CCCTCACCGG CGGTCAGGCC 
GTCACCGAGG ACATCGGCGT CAAGCTCGAC GGCGTGACCC TCCAGGAGCT GGGCCAGGCC 
AAGCGCGTTG TCATCACCAA GGACAACACC ACCATCGTCG AGGGCGCGGG CGAGACCAGC 
GCCATCGAGG GCCGGGTCAA GCAGATCCGC CGCGAGGTCG AGGACACCAC CAGCGACTAC 
GACCGCGAGA AGCTGCAGGA GCGCCTGGCC AAGCTGGTCG GCGGTGTCGC CGTCATCCGC 
GTGGGTGCGG CAACCGAGGT CGAGATGAAG GAGAAGAAGG CGCGCGTGGA AGACGCCATG 
CACGCCACCC GCGCGGCCGT CGAAGAGGGC ATCGTCCCCG GCGGCGGTGT CGCTCTCATC 
CGCTCGGGCA GCCGTCTCGA CAAGCTCACC TTCGACGACG ACCGCCGCTT CGGCGTCAAC 
ATCGTGCGCC AGGCCATCGA GGCGCCGCTG CGCCAGATCT CGCACAACGC GGGCGTGGAC 
GGCTCGATCA TCGTCTCCAA GGTGCGCGAG GGCGAGGGCA ACTTCGGCTA CAACGCCGCC 
ACCCTCGAGT ACCAGGACCT GGTCGAGAAC GGCGTCATCG ACCCGACCAA GGTCGTGCGC 
TCGGCGCTGC AGAACGCGGC CTCGGTCGCC GGTCTGATGC TGACCACCGA GGCCCTCGTG 
GCCGAGAAGG TCAAGGACGA GGACGACGCC GGCTCTCACG ACCACGGCGA CTACTGA

Protein sequence

MAAKEIVFST QARAEIAKGL NMLANAVKVT LGPRGRNVVI EKSWGAPTVT KDGVTVAKEV 
EVTNKLQNMG AQMMKEVASK TSDIAGDGTT TATVLAQAIF TEGAKLVAAG VNPMDLKRGI 
EAAVEEIVDE LSKLSTPTKG KTDIAQVGTI SANGDSTIGD MIAEAMEKVG KEGVITVEES 
KTMQSELDVV EGMQFDRGYL SPYFVTDPDR MEVVLNDPFL LICEKKISNM KDLLPVLEQV 
AKSGRPLLIL AEDVDGEALA TLVVNKLRGT LQVAAVKAPG FGDRRKAMLT DIATLTGGQA 
VTEDIGVKLD GVTLQELGQA KRVVITKDNT TIVEGAGETS AIEGRVKQIR REVEDTTSDY 
DREKLQERLA KLVGGVAVIR VGAATEVEMK EKKARVEDAM HATRAAVEEG IVPGGGVALI 
RSGSRLDKLT FDDDRRFGVN IVRQAIEAPL RQISHNAGVD GSIIVSKVRE GEGNFGYNAA 
TLEYQDLVEN GVIDPTKVVR SALQNAASVA GLMLTTEALV AEKVKDEDDA GSHDHGDY