Gene Strop_3841 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_3841
Symbol
ID	5060319
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	4401307
End bp	4402938
Gene Length	1632 bp
Protein Length	543 aa
Translation table	11
GC content	70%
IMG OID	640476098
Product	chaperonin GroEL
Protein accession	YP_001160649
Protein GI	145596352
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAAGA TCCTGAGCTT CTCGGACGAC GCTCGGCACC AGCTGGAGCA CGGTGTCAAC 
GCCCTCGCGG ATGCGGTCAA GGTCACCCTC GGCCCCCGCG GGCGCAACGT CGTCCTGGAC 
AAGAAGTTTG GTGCACCCAC GATCACCAAC GACGGCGTGA CGATCGCCAA GGAGATCGAG 
CTCACCGACC CGCACGAGAA CCTCGGCGCG CAGCTGGTCA AGGAGGTGGC GACCAAGACC 
AACGACGTCG CCGGCGACGG GACCACCACC GCCACCGTGC TGGCCCAGGC GTTGGTCCGG 
GAGGGCCTGC GTAACGTGGC GGCCGGCGCC AACCCGACCG GCCTCAAGCG GGGTATCGAC 
GCGGCGGCCA CCAAGGTCTC CGAGGCGCTG CTCGGCAAGG CCGTCGAGGT GTCGGACAAG 
GCGGCGATCG CGCACGTCGC GACCGTCTCC GCGCAGGACT CCACGATCGG TGAGCTCATC 
GCCGAGGCGA TGGAGCGGGT CGGCCGCGAC GGTGTCATCA CCGTCGAGGA GGGCTCCACC 
CTCGCCACCG AGCTGGACGT GACCGAGGGT CTCCAGTTCG ACAAGGGCTT CATCTCGCCC 
AACTTCGTCA CTGACGCGGA GGGGCAGGAG TCGGTCCTGG AGGACCCGTA CATCCTCATC 
ACCACGCAGA AGATCTCGGC GATCGAGGAG CTGCTACCGC TGCTGGAGAA GGTCCTCCAG 
GACAGCAAGC CGCTGCTCAT CATCGCCGAG GACGTCGAGG GCCAGGCGCT GTCCACGCTG 
GTGGTCAACG CGCTCCGCAA GACCATGAAG GTCTGCGCGG TGAAGGCTCC CGGCTTCGGT 
GACCGCCGCA AGGCGATGTT GCAGGACATG GCGATCCTGA CCGGTGCCGA GCTGGTCGCC 
CCCGAGCTGG GCTACAAGCT TGACCAGGTC GGGCTGGAGG TGCTCGGCAC CGCTCGCCGG 
GTGGTGGTCG ACAAGGAGAC CACCACCGTC GTCGACGGCG GCGGCCAGGC CGCCGACGCC 
GCGGACCGGG TCGCCCAGAT CCGCAAGGAG ATCGAGGCTT CGGACTCCGA GTGGGACCGG 
GAGAAGCTCG CCGAGCGGCT GGCCAAGCTC TCCGGTGGCG TTGCCGTGAT CCGGGCGGGC 
GCGGCGACCG AGGTCGAGAT GAAGGAGCGC AAGCACCGCA TCGAGGACGC CATCGCCGCC 
ACCAAGGCCG CGGTCGAGGA GGGCACGATC CCCGGCGGCG GTGCCGCCCT GGCCCAGGTC 
CTGCCGGCGC TCGACGACGA CCTCGGCCTC GACGGGGACG AGAAGGTCGG CGTCTCGATC 
GTGCGCAAGG CGCTGGTCGA GCCGCTGCGC TGGATCGCCC AGAACGCCGG CCACGACGGC 
TACGTGGTGG TGCAGAAGGT CGTCGACAAG GACTGGGGCC ACGGCCTCGA CGCGGCTACC 
GGCGAGTACG TCGACCTGGC AAAGGCTGGC ATCCTCGACC CGGTGAAGGT GACCCGCAAC 
GCGGTCGCCA ACGCCGCGTC GATCGCGGGC CTGCTGCTCA CCACCGAGAG CCTCGTGGTG 
GACAAGCCGC AGGAGCCGGA GCCGGCCGCG GGTGGCCACG GCCACGGTCA CCAGCACGGC 
CCGGGTTTCT GA

Protein sequence

MAKILSFSDD ARHQLEHGVN ALADAVKVTL GPRGRNVVLD KKFGAPTITN DGVTIAKEIE 
LTDPHENLGA QLVKEVATKT NDVAGDGTTT ATVLAQALVR EGLRNVAAGA NPTGLKRGID 
AAATKVSEAL LGKAVEVSDK AAIAHVATVS AQDSTIGELI AEAMERVGRD GVITVEEGST 
LATELDVTEG LQFDKGFISP NFVTDAEGQE SVLEDPYILI TTQKISAIEE LLPLLEKVLQ 
DSKPLLIIAE DVEGQALSTL VVNALRKTMK VCAVKAPGFG DRRKAMLQDM AILTGAELVA 
PELGYKLDQV GLEVLGTARR VVVDKETTTV VDGGGQAADA ADRVAQIRKE IEASDSEWDR 
EKLAERLAKL SGGVAVIRAG AATEVEMKER KHRIEDAIAA TKAAVEEGTI PGGGAALAQV 
LPALDDDLGL DGDEKVGVSI VRKALVEPLR WIAQNAGHDG YVVVQKVVDK DWGHGLDAAT 
GEYVDLAKAG ILDPVKVTRN AVANAASIAG LLLTTESLVV DKPQEPEPAA GGHGHGHQHG 
PGF