Gene Arth_0779 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0779
Symbol	groEL
ID	4446701
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	842649
End bp	844286
Gene Length	1638 bp
Protein Length	545 aa
Translation table	11
GC content	63%
IMG OID	639688585
Product	chaperonin GroEL
Protein accession	YP_830277
Protein GI	116669344
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCAAGA TCATTGCATT TGATGAAGAG GCACGCCGCG GTCTTGAGCG GGGCCTGAAC 
ATCCTCGCCG ACGCCGTCAA GGTCACCCTC GGCCCGCGTG GACGCAACGT TGTCCTCGAA 
AAGAAGTGGG GCGCCCCCAC GATCACCAAC GATGGTGTTT CCATCGCCAA GGAGATCGAG 
CTGGACGATC CCTACGAGAA GATCGGCGCC GAGCTGGTCA AGGAAGTTGC CAAGAAGACG 
GACGACGTCG CTGGCGACGG CACCACCACG GCAACCGTGC TCGCACAGGC CCTGGTCAAG 
GAAGGCCTGC GCAACGTCGC GGCCGGTGCT GATCCGCTGT CCCTGAAGCG CGGCATCGAG 
AAGGCTGTTG AAGCCGTCAC CGCCGAACTG CTGGCGTCCG CCAAGGAAAT CGAAACCAAG 
GAAGAGATCG CCGCTACGGC ATCGATTTCC GCCGGTGACG ACGAAATCGG CGCGCTGATC 
GCAGAGGCGT TGGACAAGGT CGGCAAGGAA GGTGTTATCA CCGTCGAGGA GTCCAACACC 
TTCGGACTCG AGCTTGAACT GACCGAAGGC ATGCGCTTCG ACAAGGGCTA CATCTCCGCT 
TACTTCGTCA CCGACGCTGA GCGCCAGGAG ACGGTCCTCG AAGACCCGTA CATCCTGATC 
GTCAACTCCA AGATCTCCAA CGTCAAGGAA CTGGTTGCTG TCCTCGAAAA GGTCATGCAG 
TCCAACAAGC CGCTGCTGAT CATTGCCGAA GACATCGAGG GCGAAGCCCT TGCCACCCTG 
ATCGTCAACA AGATCCGTGG CACCTTCAAG TCCGTCGCCG TCAAGGCTCC GGGCTTCGGC 
GACCGCCGCA AGGCTCAGCT CGCCGACATC GCCATCCTCA CCGGTGGCCA GGTCATCTCC 
GAGGAAGTCG GCCTCAAGCT TGAGACCGCC GGCCTCGAAC TCCTGGGCAA GGCACGCAAG 
GTCGTTGTCA CCAAGGATGA GACCACCATC GTCGAGGGTG CAGGCGACGC CGACCAGATC 
GCCGGCCGCG TTTCCCAGAT CCGTTCCGAG ATCGAGAACT CCGATTCCGA CTACGACCGC 
GAGAAGCTGC AGGAGCGCCT GGCCAAGCTG GCCGGCGGCG TTGCAGTCAT CAAGGCCGGT 
GCCGCTACCG AAGTTGAGCT CAAGGAACGC AAGCACCGCA TCGAGGACGC TGTCCGCAAC 
GCGAAGGCTG CCGTTGAAGA AGGCATCGTT GCCGGTGGTG GCGTGGCCCT GATCCAGGCC 
GGCGCCAAGG CATTCGCCAA CCTGCAGCTC GAAGGCGATG AAGCAACGGG CGCCAACATC 
GTCCGCGTTG CCATTGACGC GCCGCTGAAG CAGATTGCAT TCAACGCCGG CCTCGAGCCG 
GGCGTTGTTG TAGACAAGGT CCGTGGCCTG CCTGCAGGTC ATGGCCTGAA CGCCGCAACC 
GGACAGTACG TTGACCTGCT GGCTGCCGGC ATCAACGACC CCGTCAAGGT AACGCGCTCT 
GCCCTGCAGA ACGCTGCTTC CATCGCGGGT CTGTTCCTCA CCACCGAGGC CGTCGTGGCC 
GACAAGCCGG AGAAGAACGC TCCGGCCATG GGTGGCGGCG ACGACATGGG CGGTATGGGC 
GGCATGGGCG GTTTCTAA

Protein sequence

MAKIIAFDEE ARRGLERGLN ILADAVKVTL GPRGRNVVLE KKWGAPTITN DGVSIAKEIE 
LDDPYEKIGA ELVKEVAKKT DDVAGDGTTT ATVLAQALVK EGLRNVAAGA DPLSLKRGIE 
KAVEAVTAEL LASAKEIETK EEIAATASIS AGDDEIGALI AEALDKVGKE GVITVEESNT 
FGLELELTEG MRFDKGYISA YFVTDAERQE TVLEDPYILI VNSKISNVKE LVAVLEKVMQ 
SNKPLLIIAE DIEGEALATL IVNKIRGTFK SVAVKAPGFG DRRKAQLADI AILTGGQVIS 
EEVGLKLETA GLELLGKARK VVVTKDETTI VEGAGDADQI AGRVSQIRSE IENSDSDYDR 
EKLQERLAKL AGGVAVIKAG AATEVELKER KHRIEDAVRN AKAAVEEGIV AGGGVALIQA 
GAKAFANLQL EGDEATGANI VRVAIDAPLK QIAFNAGLEP GVVVDKVRGL PAGHGLNAAT 
GQYVDLLAAG INDPVKVTRS ALQNAASIAG LFLTTEAVVA DKPEKNAPAM GGGDDMGGMG 
GMGGF