Gene SeHA_C4748 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4748
Symbol	groEL
ID	6488061
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	4628968
End bp	4630614
Gene Length	1647 bp
Protein Length	548 aa
Translation table	11
GC content	55%
IMG OID	642744802
Product	chaperonin GroEL
Protein accession	YP_002048378
Protein GI	194451344
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.729761
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	65
Fosmid unclonability p-value	0.333677
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGCTA AAGACGTAAA ATTCGGTAAC GACGCTCGTG TGAAAATGCT GCGCGGCGTA 
AACGTACTGG CAGATGCAGT GAAAGTAACC CTCGGTCCGA AAGGCCGTAA CGTGGTTCTG 
GATAAATCTT TCGGTGCGCC GACTATCACT AAAGATGGTG TTTCCGTAGC GCGTGAAATC 
GAACTGGAAG ACAAGTTTGA AAACATGGGC GCGCAGATGG TGAAAGAAGT TGCCTCTAAA 
GCGAACGATG CTGCAGGCGA CGGCACCACC ACCGCGACCG TACTGGCGCA GTCCATCATT 
ACCGAAGGCT TGAAAGCCGT TGCTGCGGGC ATGAACCCGA TGGACCTGAA ACGTGGTATC 
GACAAAGCGG TTGCTGCGGC GGTTGAAGAG CTGAAAGCCC TGTCCGTACC GTGCTCCGAC 
TCTAAAGCGA TTGCTCAGGT AGGTACTATC TCCGCTAACT CCGACGAAAC CGTAGGTAAA 
CTGATTGCGG AAGCGATGGA TAAAGTCGGT AAAGAAGGCG TCATCACCGT TGAAGACGGT 
ACCGGTCTGC AGGACGAACT GGACGTGGTT GAAGGTATGC AGTTTGACCG CGGCTACCTG 
TCTCCTTACT TCATCAACAA GCCGGAAACT GGCGCAGTAG AGCTGGAAAG CCCGTTCATC 
CTGCTGGCTG ATAAGAAAAT CTCCAACATC CGCGAAATGC TGCCGGTTCT GGAAGCCGTT 
GCAAAAGCAG GCAAACCGCT GCTGATCATC GCTGAAGATG TTGAAGGCGA AGCGCTGGCT 
ACCCTGGTAG TGAACACCAT GCGTGGCATC GTGAAAGTGG CTGCTGTTAA GGCACCGGGC 
TTCGGCGATC GTCGTAAGGC GATGCTGCAG GATATCGCTA CCCTGACCGG CGGTACCGTA 
ATCTCTGAAG AGATCGGTAT GGAGCTGGAA AAAGCAACCC TGGAAGACCT GGGTCAGGCG 
AAACGTGTTG TGATCAACAA AGACACCACC ACCATCATCG ATGGCGTGGG TGAAGAAGCT 
GCCATCCAGG GCCGTGTTGC TCAGATCCGT CAGCAGATTG AAGAAGCGAC CTCCGACTAC 
GATCGTGAAA AACTGCAGGA GCGCGTAGCG AAACTGGCAG GCGGCGTTGC GGTTATCAAA 
GTTGGCGCTG CGACCGAAGT TGAAATGAAA GAGAAGAAAG CCCGCGTTGA AGATGCCCTG 
CACGCGACCC GTGCTGCGGT AGAAGAAGGC GTGGTTGCTG GTGGTGGCGT TGCGCTGATC 
CGCGTTGCTT CTAAAATTGC TGACCTGAAA GGCCAGAACG AAGACCAGAA CGTGGGTATC 
AAAGTTGCGC TGCGCGCAAT GGAAGCTCCG CTGCGTCAGA TCGTGCTGAA CTGCGGCGAA 
GAGCCGTCTG TTGTCGCTAA CACCGTTAAA GGCGGCGACG GTAACTACGG TTACAACGCA 
GCAACTGAAG AATACGGCAA CATGATCGAT ATGGGTATCC TGGACCCAAC CAAAGTTACC 
CGTTCTGCGC TGCAGTACGC GGCTTCTGTG GCTGGTCTGA TGATCACTAC CGAGTGCATG 
GTGACCGACC TGCCGAAAAG CGATGCTCCT GATTTAGGCG CTGCTGGCGG CATGGGTGGT 
ATGGGTGGTA TGGGCGGCAT GATGTAA

Protein sequence

MAAKDVKFGN DARVKMLRGV NVLADAVKVT LGPKGRNVVL DKSFGAPTIT KDGVSVAREI 
ELEDKFENMG AQMVKEVASK ANDAAGDGTT TATVLAQSII TEGLKAVAAG MNPMDLKRGI 
DKAVAAAVEE LKALSVPCSD SKAIAQVGTI SANSDETVGK LIAEAMDKVG KEGVITVEDG 
TGLQDELDVV EGMQFDRGYL SPYFINKPET GAVELESPFI LLADKKISNI REMLPVLEAV 
AKAGKPLLII AEDVEGEALA TLVVNTMRGI VKVAAVKAPG FGDRRKAMLQ DIATLTGGTV 
ISEEIGMELE KATLEDLGQA KRVVINKDTT TIIDGVGEEA AIQGRVAQIR QQIEEATSDY 
DREKLQERVA KLAGGVAVIK VGAATEVEMK EKKARVEDAL HATRAAVEEG VVAGGGVALI 
RVASKIADLK GQNEDQNVGI KVALRAMEAP LRQIVLNCGE EPSVVANTVK GGDGNYGYNA 
ATEEYGNMID MGILDPTKVT RSALQYAASV AGLMITTECM VTDLPKSDAP DLGAAGGMGG 
MGGMGGMM