Gene EcE24377A_4698 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_4698
Symbol	groEL
ID	5587547
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	4702427
End bp	4704073
Gene Length	1647 bp
Protein Length	548 aa
Translation table	11
GC content	53%
IMG OID	640928310
Product	chaperonin GroEL
Protein accession	YP_001465641
Protein GI	157159099
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGCTA AAGACGTAAA ATTCGGTAAC GACGCTCGTG TGAAAATGCT GCGCGGCGTA 
AACGTACTGG CAGATGCAGT GAAAGTTACC CTCGGTCCGA AAGGCCGTAA CGTAGTTCTG 
GATAAATCTT TCGGTGCACC GACCATCACC AAAGATGGTG TTTCCGTTGC TCGTGAAATC 
GAACTGGAAG ACAAGTTCGA AAATATGGGT GCGCAGATGG TGAAAGAAGT TGCCTCTAAA 
GCGAACGACG CTGCAGGCGA CGGTACCACC ACTGCAACTG TACTGGCTCA GGCTATCATC 
ACTGAGGGTC TGAAAGCTGT TGCTGCGGGC ATGAACCCGA TGGACCTGAA ACGTGGTATC 
GACAAAGCCG TTACCGCTGC AGTTGAAGAA CTGAAAGCGC TGTCCGTACC GTGCTCTGAC 
TCTAAAGCGA TTGCTCAGGT TGGTACCATC TCCGCTAACT CCGACGAAAC CGTAGGTAAA 
CTGATCGCTG AAGCGATGGA CAAAGTCGGT AAAGAAGGCG TTATCACCGT TGAAGACGGT 
ACCGGTCTGC AGGACGAACT GGACGTGGTT GAAGGTATGC AGTTCGACCG TGGCTACCTG 
TCTCCTTACT TCATCAACAA GCCGGAAACT GGCGCAGTAG AACTGGAAAG CCCGTTCATC 
CTGCTGGCTG ACAAGAAAAT CTCTAACATC CGCGAAATGC TGCCGGTTCT GGAAGCTGTT 
GCCAAAGCAG GCAAACCGCT GCTGATCATC GCTGAAGATG TTGAAGGCGA AGCGCTGGCA 
ACTCTGGTTG TTAACACCAT GCGTGGCATC GTGAAAGTTG CTGCGGTTAA AGCTCCGGGC 
TTCGGCGATC GTCGTAAAGC TATGCTGCAG GATATCGCAA CCCTGACTGG CGGTACCGTA 
ATCTCTGAAG AGATCGGTAT GGAGCTGGAA AAAGCAACCC TGGAAGACCT GGGTCAGGCT 
AAACGTGTTG TGATCAACAA AGACACCACC ACTATCATCG ATGGCGTGGG TGAAGAAGCT 
GCAATCCAGG GCCGTGTTGC TCAGATCCGT CAGCAGATTG AAGAAGCAAC TTCTGACTAC 
GACCGTGAAA AACTGCAGGA ACGCGTAGCG AAACTGGCAG GCGGCGTTGC AGTTATCAAA 
GTAGGTGCTG CTACCGAAGT TGAAATGAAA GAGAAAAAAG CACGCGTTGA AGACGCCCTG 
CACGCGACCC GTGCTGCGGT AGAAGAAGGC GTGGTTGCTG GTGGTGGTGT TGCGCTGATC 
CGCGTAGCGT CTAAACTGGC TGACCTGCGT GGTCAGAACG AAGACCAGAA CGTGGGTATC 
AAAGTTGCAC TGCGTGCAAT GGAAGCTCCG CTGCGTCAGA TCGTCCTGAA CTGCGGCGAA 
GAACCGTCTG TTGTTGCTAA CACCGTTAAA GGCGGCGACG GCAACTACGG TTACAACGCA 
GCAACCGAAG AATACGGCAA CATGATCGAC ATGGGTATCC TGGACCCAAC CAAAGTAACC 
CGTTCTGCTC TGCAGTACGC GGCTTCTGTG GCTGGCCTGA TGATCACCAC CGAGTGCATG 
GTTACCGACC TGCCGAAAAA TGATGCAGCT GACTTAGGCG CTGCTGGCGG TATGGGCGGC 
ATGGGTGGCA TGGGCGGCAT GATGTAA

Protein sequence

MAAKDVKFGN DARVKMLRGV NVLADAVKVT LGPKGRNVVL DKSFGAPTIT KDGVSVAREI 
ELEDKFENMG AQMVKEVASK ANDAAGDGTT TATVLAQAII TEGLKAVAAG MNPMDLKRGI 
DKAVTAAVEE LKALSVPCSD SKAIAQVGTI SANSDETVGK LIAEAMDKVG KEGVITVEDG 
TGLQDELDVV EGMQFDRGYL SPYFINKPET GAVELESPFI LLADKKISNI REMLPVLEAV 
AKAGKPLLII AEDVEGEALA TLVVNTMRGI VKVAAVKAPG FGDRRKAMLQ DIATLTGGTV 
ISEEIGMELE KATLEDLGQA KRVVINKDTT TIIDGVGEEA AIQGRVAQIR QQIEEATSDY 
DREKLQERVA KLAGGVAVIK VGAATEVEMK EKKARVEDAL HATRAAVEEG VVAGGGVALI 
RVASKLADLR GQNEDQNVGI KVALRAMEAP LRQIVLNCGE EPSVVANTVK GGDGNYGYNA 
ATEEYGNMID MGILDPTKVT RSALQYAASV AGLMITTECM VTDLPKNDAA DLGAAGGMGG 
MGGMGGMM