Gene Hore_02010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_02010
Symbol
ID	7312520
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	+
Start bp	206110
End bp	207753
Gene Length	1644 bp
Protein Length	547 aa
Translation table	11
GC content	44%
IMG OID	643610624
Product	chaperonin GroEL
Protein accession	YP_002507958
Protein GI	220931050
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.000193134
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAAAG AATTAAAATT TAGTGAAGAT GCTCGCCGTG CTCTGGAACG CGGTGTTGAT 
ACTCTGGCAA ATGCTGTTAA AGTAACTTTA GGTCCAAAAG GACGAAATGT AGTTCTTGAA 
AAGAGCTTTG GAGCTCCTAC TATCACCAAC GATGGTGTTA GTATTGCCCG TGAAATAGAA 
CTTGAAAATC ACTACGAAAA CATGGGGGCT CAGACTGTAA AAGAGGTTGC TACCAAAACC 
AATGATGTTG CCGGTGATGG TACAACCACT GCTACAGTAC TGGCTCAGGC TATTTTCAAG 
GAAGGTTTAA AGAATGTGGC CGCCGGTGCC AACCCCATGA TCCTGAAAAG GGGTATTGAA 
AAGGCCGTTC AGAAGCTGGT AGAAGAGATT AAGGAACTAA GCAAACCTGT TGAAGGAAAA 
GAAGCAGTTT CCCAGGTTGC TGCTATTTCT GCCGGTAATG ATGAAGAAGT CGGTAAGCTT 
ATTGCTGAAG CTATGGAGAA AGTTGGTCAG GATGGAGTTA TCTCTGTTGA AGAATCCAAG 
AGTATGGGGA CTTCTTTAGA TGTAGTTGAA GGTATGCAGT TCGATAGAGG ATATCTCTCC 
CCCTATATGG TAACCGATAC TGATGCTATG GAAGCTTCCC TTGAAGATCC CTATATCCTG 
ATCACTGACA AGAAGATATC TAATATCCAG GAAATCTTAC CCCTGTTAGA AAAAGTAGCC 
CAGAGTGGTA AACCTCTCTT AATAATTGCT GAAGATGTTG AAGGGGAAGC CCTGGCTACT 
CTTGTTGTCA ACAAGATTCG TGGTACCTTT AACTGTGTTG CTGTTAAAGC ACCTGGCTTT 
GGTGATCGTC GTAAGGCTAT GTTAGAAGAC ATTGCTATTC TGACCGGTGG TCAGGTAATC 
ACTGAAGACC TGGGTCTCAA GCTCGAAAAT GCTGATATTA GTATGCTTGG TCGGGCCCAC 
AAAGTAACAG TAACCAAAGA GGATACTACT ATTGTAGAAG GTGCTGGAGA TAGCAAAGAA 
ATTCAGAATA GAATTAAGCA GATCAGGACT CAAATTGAAA ATACTGATTC TGATTTTGAC 
AGGGAAAAAC TGCAGGAAAG ACTGGCTAAA CTGGCCGGTG GTGTGGCTGT AATTAAGGTT 
GGTGCTGCTA CTGAAACTGA ATTAAAAGAA AAGAAACACC GTATTGAAGA TGCTCTCTCT 
GCTACCAGGG CCGCTGTAGA AGAAGGACTG GTAGCCGGTG GTGGAACCAC CCTTATTGAT 
GCCATTCCTG CCCTTGATGA ACTGAACCTT GAAGGTGACG AAGCTACCGG TGTTGACATT 
GTTAGAAAAG CACTTGAAGC CCCGGTACGT CTCATAGCAG ACAATGCCGG TTATGAAGGT 
TCAGTAATTG TTGAGAAGGT TAAGTCTGAA GATAAAGGTA TCGGTTTCGA TGCCTATAAC 
GGTGAGTTTG TAAATATGAT TGAATCCGGT ATTGTAGACC CGGCTAAGGT AACCCGTTCT 
GCCCTTCAGA ATGCTGCCAG TGCTGCTGCT ATGTTGCTGA CTACTGAATG CCTGGTGGCT 
GATAAAGAAG AGGATAATGA CAGTAATGGT AATGCCGGAA TGCCCGGTGG CGGTATGCCC 
GGCGGAATGG GTGGCATGAT GTAA

Protein sequence

MAKELKFSED ARRALERGVD TLANAVKVTL GPKGRNVVLE KSFGAPTITN DGVSIAREIE 
LENHYENMGA QTVKEVATKT NDVAGDGTTT ATVLAQAIFK EGLKNVAAGA NPMILKRGIE 
KAVQKLVEEI KELSKPVEGK EAVSQVAAIS AGNDEEVGKL IAEAMEKVGQ DGVISVEESK 
SMGTSLDVVE GMQFDRGYLS PYMVTDTDAM EASLEDPYIL ITDKKISNIQ EILPLLEKVA 
QSGKPLLIIA EDVEGEALAT LVVNKIRGTF NCVAVKAPGF GDRRKAMLED IAILTGGQVI 
TEDLGLKLEN ADISMLGRAH KVTVTKEDTT IVEGAGDSKE IQNRIKQIRT QIENTDSDFD 
REKLQERLAK LAGGVAVIKV GAATETELKE KKHRIEDALS ATRAAVEEGL VAGGGTTLID 
AIPALDELNL EGDEATGVDI VRKALEAPVR LIADNAGYEG SVIVEKVKSE DKGIGFDAYN 
GEFVNMIESG IVDPAKVTRS ALQNAASAAA MLLTTECLVA DKEEDNDSNG NAGMPGGGMP 
GGMGGMM