Gene EcolC_3869 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3869
Symbol	groEL
ID	6065803
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4224403
End bp	4226049
Gene Length	1647 bp
Protein Length	548 aa
Translation table	11
GC content	53%
IMG OID	641603284
Product	chaperonin GroEL
Protein accession	YP_001726800
Protein GI	170021846
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.749849
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGCTA AAGACGTAAA ATTCGGTAAC GACGCTCGTG TGAAAATGCT GCGCGGCGTA 
AACGTACTGG CAGATGCAGT GAAAGTTACC CTCGGTCCGA AAGGCCGTAA CGTAGTTCTG 
GATAAATCTT TCGGTGCACC GACCATCACC AAAGATGGTG TTTCCGTTGC TCGTGAAATC 
GAACTGGAAG ACAAGTTCGA AAACATGGGT GCGCAGATGG TGAAAGAAGT TGCCTCTAAA 
GCGAACGACG CTGCAGGCGA CGGTACCACC ACTGCAACTG TACTGGCTCA GGCTATCATC 
ACTGAGGGTC TGAAAGCTGT TGCTGCGGGC ATGAACCCGA TGGACCTGAA ACGTGGTATC 
GACAAAGCCG TTACCGCTGC AGTTGAAGAA CTGAAAGCGC TGTCCGTACC GTGCTCTGAC 
TCTAAAGCGA TTGCTCAGGT TGGTACCATC TCCGCTAACT CCGACGAAAC CGTAGGTAAA 
CTGATCGCTG AAGCGATGGA CAAAGTCGGT AAAGAAGGCG TTATCACCGT TGAAGACGGT 
ACCGGTCTGC AGGACGAACT GGACGTGGTT GAAGGTATGC AGTTCGACCG TGGCTACCTG 
TCTCCTTACT TCATCAACAA GCCGGAAACT GGCGCAGTAG AACTGGAAAG CCCGTTCATC 
CTGCTGGCTG ACAAGAAAAT CTCTAACATC CGCGAAATGC TGCCGGTTCT GGAAGCTGTT 
GCCAAAGCAG GCAAACCGCT GCTGATCATC GCTGAAGATG TTGAAGGCGA AGCGCTGGCA 
ACTCTGGTTG TTAACACCAT GCGTGGCATC GTGAAAGTTG CTGCGGTTAA AGCTCCGGGC 
TTCGGCGATC GTCGTAAAGC TATGCTGCAG GATATCGCAA CCCTGACTGG CGGTACCGTA 
ATCTCTGAAG AGATCGGTAT GGAGCTGGAA AAAGCAACCC TGGAAGACCT GGGTCAGGCT 
AAACGTGTTG TGATCAACAA AGACACCACC ACTATCATCG ATGGCGTGGG TGAAGAAGCT 
GCAATCCAGG GCCGTGTTGC TCAGATCCGT CAGCAGATTG AAGAAGCAAC TTCTGACTAC 
GACCGTGAAA AACTGCAGGA ACGCGTAGCG AAACTGGCAG GCGGCGTTGC AGTTATCAAA 
GTAGGTGCTG CTACCGAAGT TGAAATGAAA GAGAAAAAAG CACGCGTTGA AGACGCCCTG 
CACGCGACCC GTGCTGCGGT AGAAGAAGGC GTGGTTGCTG GTGGTGGTGT TGCGCTGATC 
CGCGTAGCGT CTAAACTGGC TGACCTGCGT GGTCAGAACG AAGACCAGAA CGTGGGTATC 
AAAGTTGCAC TGCGTGCAAT GGAAGCTCCG CTGCGTCAGA TCGTCCTGAA CTGCGGCGAA 
GAACCGTCTG TTGTTGCTAA CACCGTTAAA GGCGGCGACG GCAACTACGG TTACAACGCA 
GCAACCGAAG AATACGGCAA CATGATCGAC ATGGGTATCC TGGACCCAAC CAAAGTAACC 
CGTTCTGCTC TGCAGTACGC GGCTTCTGTG GCTGGCCTGA TGATCACCAC CGAGTGCATG 
GTTACCGACC TGCCGAAAAA TGATGCAGCT GACTTAGGCG CTGCTGGCGG TATGGGCGGC 
ATGGGTGGCA TGGGCGGCAT GATGTAA

Protein sequence

MAAKDVKFGN DARVKMLRGV NVLADAVKVT LGPKGRNVVL DKSFGAPTIT KDGVSVAREI 
ELEDKFENMG AQMVKEVASK ANDAAGDGTT TATVLAQAII TEGLKAVAAG MNPMDLKRGI 
DKAVTAAVEE LKALSVPCSD SKAIAQVGTI SANSDETVGK LIAEAMDKVG KEGVITVEDG 
TGLQDELDVV EGMQFDRGYL SPYFINKPET GAVELESPFI LLADKKISNI REMLPVLEAV 
AKAGKPLLII AEDVEGEALA TLVVNTMRGI VKVAAVKAPG FGDRRKAMLQ DIATLTGGTV 
ISEEIGMELE KATLEDLGQA KRVVINKDTT TIIDGVGEEA AIQGRVAQIR QQIEEATSDY 
DREKLQERVA KLAGGVAVIK VGAATEVEMK EKKARVEDAL HATRAAVEEG VVAGGGVALI 
RVASKLADLR GQNEDQNVGI KVALRAMEAP LRQIVLNCGE EPSVVANTVK GGDGNYGYNA 
ATEEYGNMID MGILDPTKVT RSALQYAASV AGLMITTECM VTDLPKNDAA DLGAAGGMGG 
MGGMGGMM