Gene HS_0468 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_0468
Symbol	groEL
ID	4239950
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	499717
End bp	501360
Gene Length	1644 bp
Protein Length	547 aa
Translation table	11
GC content	42%
IMG OID	638104016
Product	chaperonin GroEL
Protein accession	YP_718679
Protein GI	113460613
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0739991
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGCAA AAGACGTAAA ATTTGGTAAT GATGCTCGTG TAAAAATGCT AGCAGGTGTG 
AATGTTTTAG CAGATGCAGT AAAAGTTACT TTAGGACCTA AAGGTCGCAA CGTAATTTTA 
GACAAGGCTT TTGGTGCACC TACTATTACT AAAGACGGTG TGTCTGTGGC TCGTGAAATC 
GAATTGGAAG ATAAATTTGA AAATATGGGT GCACAAATGG TGAAAGAGGT TGCCTCTAAA 
GCAAATGATG CTGCAGGCGA TGGTACAACC ACAGCAACAG TTTTGGCTCA AGCGATTGTC 
AGCGAAGGTC TAAAAGCAGT AGCTGCCGGA ATGAATCCGA TGGATTTAAA ACGTGGAATT 
GATAAAGCAG TTAATGCAGT GGTTGAAGAG CTAAAAATTC TTTCTAAACC TTGTGAAACG 
TCAAAAGAAA TTGAACAGGT TGGTACAATT TCCGCAAACG CCGATGAAAC TGTCGGTAAG 
CTTATTGCTC AAGCAATGGA AAAAGTCGGT AAAGAGGGGG TTATTACCGT TGAGGACGGT 
TCCGGTCTTT CAGATGAATT GGATGTTGTT GAGGGTATGC AATTTGACCG CGGTTATTTA 
TCACCATACT TCATTAATAA ACCGGAAGCC GCAACTGTTG AATTAGATAA TCCGTTTATT 
CTTCTTGTTG ATAAAAAGAT CTCTAATATT CGTGAATTAT TACCGGTCCT AGAAGGTGTA 
GCGAAAGCTG GTAAACCATT GTTAATTATC GCAGAAGATG TGGAAGGCGA AGCACTTGCA 
ACGTTGGTTG TTAACACGAT GCGTGGTATT GTTAAAGTTG CTGCGGTTAA AGCCCCGGGA 
TTTGGAGATC GTCGTAAAGC GATGTTACAG GATATTGCTA TCTTAACTGC AGGTACTGTC 
ATTTCAGAAG AAATCGGAAT GGAGCTTGAA AAAGCAACTC TTGAAGATTT AGGTCAAGCA 
AAACGTGTGG TGATCAACAA AGATAACACG ACTATTATTG ACGGTATTGG TGATGAAGCT 
CAAATCAAAG GTCGAGTTGC TCAAATTCGT CAACAAATTG AAGAAGCAAC TTCCGATTAT 
GATAAAGAAA AACTACAAGA GCGTGTTGCA AAATTAGCCG GCGGTGTTGC TGTAATTAAG 
GTTGGTGCGG CAACTGAAGT TGAAATGAAA GAGAAAAAAG ATCGTGTTGA TGATGCGTTA 
CATGCAACGC GTGCCGCTGT TGAAGAAGGG ATTGTTGCCG GTGGTGGTGT TGCATTAATC 
CGTGCTGCAA CAAAAGTTGC AACAACATTA AAAGGCGATA ACGAAGATCA AGATGTAGGT 
ATCAAACTTG CTTTACGTGC AATGGAAGCA CCACTTCGTC AAATCGTAAC CAATGCAGGA 
GAAGAAGCTT CTGTAGTTGC AAGTGCGGTT AAAAATGGTG AAGGAAACTT TGGTTATAAT 
GCTGGTACGG AGCAGTATGG TGATATGATC GCAATGGGAA TTTTAGATCC GACAAAAGTA 
ACTCGTTCCG CACTACAATT TGCTGCATCT ATCGCAGGAT TAATGGTTAC AACTGAATGT 
ATGGTAGCCG ATCTGCCGAA AGAGGAGAAA GCCGATCTGA CAGGCGGAAT GGGTGGTATG 
GGTGGAATGG GCGGTATGAT GTAG

Protein sequence

MTAKDVKFGN DARVKMLAGV NVLADAVKVT LGPKGRNVIL DKAFGAPTIT KDGVSVAREI 
ELEDKFENMG AQMVKEVASK ANDAAGDGTT TATVLAQAIV SEGLKAVAAG MNPMDLKRGI 
DKAVNAVVEE LKILSKPCET SKEIEQVGTI SANADETVGK LIAQAMEKVG KEGVITVEDG 
SGLSDELDVV EGMQFDRGYL SPYFINKPEA ATVELDNPFI LLVDKKISNI RELLPVLEGV 
AKAGKPLLII AEDVEGEALA TLVVNTMRGI VKVAAVKAPG FGDRRKAMLQ DIAILTAGTV 
ISEEIGMELE KATLEDLGQA KRVVINKDNT TIIDGIGDEA QIKGRVAQIR QQIEEATSDY 
DKEKLQERVA KLAGGVAVIK VGAATEVEMK EKKDRVDDAL HATRAAVEEG IVAGGGVALI 
RAATKVATTL KGDNEDQDVG IKLALRAMEA PLRQIVTNAG EEASVVASAV KNGEGNFGYN 
AGTEQYGDMI AMGILDPTKV TRSALQFAAS IAGLMVTTEC MVADLPKEEK ADLTGGMGGM 
GGMGGMM