Gene Jann_3358 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_3358
Symbol	groEL
ID	3935831
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	-
Start bp	3409571
End bp	3411211
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	61%
IMG OID	637905731
Product	chaperonin GroEL
Protein accession	YP_511300
Protein GI	89055849
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAAAG ACGTCCGTTT TGATACCGAC GCCCGCAATC GTATGCTGAA GGGTGTGAAC 
ACCCTCGCCG ATGCGGTCAA AGTCACGCTT GGCCCCAAAG GCCGTAACGT GGTCATCGAC 
AAGTCCTTCG GCGCGCCGCG CATCACGAAG GACGGTGTAT CCGTCGCCAA AGAGATCGAG 
CTGGAAGACA AGTTCGAGAA CATGGGCGCA CAGATGGTGA AAGAAGTCGC CAGCCGCACC 
AATGATGAGG CCGGTGACGG CACCACGACG GCAACTGTGC TGGCCCAGGC CATCATCAAG 
GAAGGCCTCA AGTCGGTTGC GGCAGGCATG AACCCGATGG ACCTCAAGCG CGGCATCGAC 
CTGGCCGTGA CCAAGGTCAT CGCCGAGATC CAGGGCTCCG CTCGCGAAGT CGCGGACAGC 
GATGAAGTCG CCCAGGTTGG CACCATTTCC GCCAACGGCG AAGCTGAAAT CGGTCGTCAG 
ATCGCCGACG CGATGCAGAA AGTCGGCAAC GACGGCGTCA TCACCGTGGA AGAGAACAAG 
GGCCTTGAGA CCGAGACCGA TGTTGTCGAA GGCATGCAGT TCGACCGTGG CTACCTGTCG 
CCCTATTTCG TGACCAACCC TGACAAGATG ATCGCCGAGT TGGACGATTG CCTGATCCTG 
CTGCACGAGA AGAAGTTGTC TTCCCTGCAG CCGATGGTCC CGCTGCTGGA GACTGTCATC 
CAGTCCGGCA AGCCGCTTCT GATCATCGCT GAAGATGTCG AAGGGGAAGC CCTGGCCACG 
CTCGTCGTCA ACAAGCTGCG TGGCGGCCTG AAGATCGCCG CCGTCAAAGC GCCCGGTTTC 
GGGGATCGTC GTAAGGCGAT GCTGCAGGAT ATCGCCATCC TGACCGGTGG CCAGGTGATC 
GCGGAAGACC TGGGCATGAA GCTCGAATCC GTGACGATGG ACATGCTCGG CACCGCCAAG 
CGTCTGACCA TCTCCAAGGA CGAGACCACG ATTGTCGACG GTGCTGGCAA CAAGCCGGAG 
ATCGAGGCGC GCGTCGCCCA GATCCGTCAG CAGATCGAGG AAAGCACCTC CGACTATGAC 
CGTGAAAAGC TGCAAGAGCG TGTTGCCAAA CTGGCAGGCG GTGTTGCCGT GATCAAGGTC 
GGCGGCATGT CCGAGATCGA AGTGAAAGAG CGTAAGGACC GCGTCGACGA CGCCCTGAAC 
GCAACCCGCG CCGCTGTCCA GGAAGGCATC GTTGTGGGCG GTGGTGTTGC TCTGGTCCAG 
GGTGGCAAGT CGCTGGCTGG TCTTGAAGGC GAGAATGCCG ACCAGAATGC CGGTATCGCC 
ATCGTGCGCC GTGCATTGGA AGCGCCGCTG CGCCAGATCG CCGAAAACTC CGGCGTCGAC 
GGGTCCGTCG TTGCGGGCAA GATCCGCGAA TCTGACGACA ACGCCTTCGG CTTCAACGCC 
CAGACGGAAG AATATGGCGA CCTGTTCAAG TTCGGCGTCA TCGACCCGGC CAAGGTTGTC 
CGCACGGCTC TGCAGGACGC GGCCTCTGTG GCTGGCCTGC TGATCACCAC GGAAGCCATG 
GTGGCCGACA AGCCTGCCAA AGAAGGCGCA CCTGCCGGTG GCGGCATGCC CGACATGGGC 
GGCATGGGCG GCATGATGTA A

Protein sequence

MAKDVRFDTD ARNRMLKGVN TLADAVKVTL GPKGRNVVID KSFGAPRITK DGVSVAKEIE 
LEDKFENMGA QMVKEVASRT NDEAGDGTTT ATVLAQAIIK EGLKSVAAGM NPMDLKRGID 
LAVTKVIAEI QGSAREVADS DEVAQVGTIS ANGEAEIGRQ IADAMQKVGN DGVITVEENK 
GLETETDVVE GMQFDRGYLS PYFVTNPDKM IAELDDCLIL LHEKKLSSLQ PMVPLLETVI 
QSGKPLLIIA EDVEGEALAT LVVNKLRGGL KIAAVKAPGF GDRRKAMLQD IAILTGGQVI 
AEDLGMKLES VTMDMLGTAK RLTISKDETT IVDGAGNKPE IEARVAQIRQ QIEESTSDYD 
REKLQERVAK LAGGVAVIKV GGMSEIEVKE RKDRVDDALN ATRAAVQEGI VVGGGVALVQ 
GGKSLAGLEG ENADQNAGIA IVRRALEAPL RQIAENSGVD GSVVAGKIRE SDDNAFGFNA 
QTEEYGDLFK FGVIDPAKVV RTALQDAASV AGLLITTEAM VADKPAKEGA PAGGGMPDMG 
GMGGMM