Gene B21_03975 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03975
Symbol	groEL
ID	8115690
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	4276201
End bp	4277847
Gene Length	1647 bp
Protein Length	548 aa
Translation table	11
GC content	53%
IMG OID	644850127
Product	hypothetical protein
Protein accession	YP_003001700
Protein GI	251787396
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGCTA AAGACGTAAA ATTCGGTAAC GACGCTCGTG TGAAAATGCT GCGCGGCGTA 
AACGTACTGG CAGATGCAGT GAAAGTTACC CTCGGTCCGA AAGGCCGTAA CGTAGTTCTG 
GATAAATCTT TCGGTGCACC GACCATCACC AAAGATGGTG TTTCCGTTGC TCGTGAAATC 
GAACTGGAAG ACAAGTTCGA AAATATGGGT GCGCAGATGG TGAAAGAAGT TGCCTCCAAA 
GCGAACGACG CTGCAGGCGA CGGTACCACC ACTGCAACCG TACTGGCTCA GGCTATCATC 
ACTGAAGGTC TGAAAGCTGT TGCTGCGGGC ATGAACCCGA TGGACCTGAA ACGTGGTATC 
GACAAAGCGG TTACCGCTGC AGTTGAAGAA CTGAAAGCGC TGTCCGTACC GTGCTCTGAT 
TCTAAAGCGA TTGCTCAGGT TGGTACCATC TCCGCTAACT CCGACGAAAC CGTAGGTAAA 
CTGATCGCAG AAGCGATGGA CAAAGTCGGT AAAGAAGGCG TTATCACCGT TGAAGACGGT 
ACCGGTCTGC AGGACGAACT GGACGTGGTT GAAGGTATGC AGTTCGACCG TGGCTACCTG 
TCTCCTTACT TCATCAACAA GCCGGAAACT GGCGCAGTAG AACTGGAAAG CCCGTTCATC 
CTGCTGGCTG ACAAGAAAAT CTCCAACATC CGCGAAATGC TGCCGGTTCT GGAAGCTGTT 
GCAAAAGCAG GTAAACCGCT GCTGATCATC GCTGAAGATG TAGAAGGCGA AGCGCTGGCA 
ACTCTGGTTG TTAACACCAT GCGTGGCATC GTGAAAGTCG CTGCGGTTAA AGCACCGGGC 
TTCGGCGATC GTCGTAAAGC TATGCTGCAG GATATCGCAA CCCTGACTGG CGGTACCGTG 
ATCTCTGAAG AGATCGGTAT GGAGCTGGAA AAAGCAACCC TGGAAGACCT GGGTCAGGCT 
AAACGTGTTG TGATCAACAA AGACACCACC ACTATCATCG ATGGCGTGGG TGAAGAAGCT 
GCAATCCAGG GCCGTGTTGC TCAGATCCGT CAGCAGATTG AAGAAGCAAC TTCTGACTAC 
GACCGTGAAA AACTGCAGGA ACGCGTAGCG AAACTGGCAG GCGGCGTTGC AGTTATCAAA 
GTAGGTGCTG CTACCGAAGT TGAAATGAAA GAGAAAAAAG CACGCGTTGA AGATGCCCTG 
CACGCGACCC GTGCAGCGGT AGAAGAGGGC GTGGTTGCTG GTGGTGGTGT TGCGCTGATC 
CGCGTAGCGT CTAAACTGGC TGACCTGCGT GGTCAGAACG AAGACCAGAA CGTGGGTATC 
AAAGTTGCAC TGCGTGCAAT GGAAGCTCCG CTGCGTCAGA TCGTATTGAA CTGCGGCGAA 
GAACCGTCTG TTGTTGCTAA CACCGTTAAA GGCGGCGACG GCAACTACGG TTACAACGCA 
GCAACCGAAG AATACGGCAA CATGATCGAC ATGGGTATCC TGGATCCAAC CAAAGTAACT 
CGTTCTGCTC TGCAGTACGC AGCTTCTGTG GCTGGCCTGA TGATCACCAC CGAGTGCATG 
GTTACCGACC TGCCGAAAAA CGATGCAGCT GACTTAGGCG CTGCTGGCGG TATGGGCGGC 
ATGGGTGGCA TGGGCGGCAT GATGTAA

Protein sequence

MAAKDVKFGN DARVKMLRGV NVLADAVKVT LGPKGRNVVL DKSFGAPTIT KDGVSVAREI 
ELEDKFENMG AQMVKEVASK ANDAAGDGTT TATVLAQAII TEGLKAVAAG MNPMDLKRGI 
DKAVTAAVEE LKALSVPCSD SKAIAQVGTI SANSDETVGK LIAEAMDKVG KEGVITVEDG 
TGLQDELDVV EGMQFDRGYL SPYFINKPET GAVELESPFI LLADKKISNI REMLPVLEAV 
AKAGKPLLII AEDVEGEALA TLVVNTMRGI VKVAAVKAPG FGDRRKAMLQ DIATLTGGTV 
ISEEIGMELE KATLEDLGQA KRVVINKDTT TIIDGVGEEA AIQGRVAQIR QQIEEATSDY 
DREKLQERVA KLAGGVAVIK VGAATEVEMK EKKARVEDAL HATRAAVEEG VVAGGGVALI 
RVASKLADLR GQNEDQNVGI KVALRAMEAP LRQIVLNCGE EPSVVANTVK GGDGNYGYNA 
ATEEYGNMID MGILDPTKVT RSALQYAASV AGLMITTECM VTDLPKNDAA DLGAAGGMGG 
MGGMGGMM