Gene Namu_4827 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4827
Symbol
ID	8450457
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	5382729
End bp	5384354
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	68%
IMG OID	645043866
Product	chaperonin GroEL
Protein accession	YP_003204091
Protein GI	258654935
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAAGC TGATCGCTTT CGACGAGGAA GCGCGTCGCG GCCTCGAGCG GGGGATGAAC 
ACCCTCGCCG ACGCCGTCAA GGTGACCTTG GGGCCGCGCG GCCGCAACGT CGTCCTGGAG 
AAGAAGTGGG GCGCGCCCAC CATCACCAAC GATGGTGTGT CGATCGCCAA GGAGATCGAG 
CTCGAGGACC CGTACGAGAA GATCGGGGCC GAGCTCGTCA AGGAAGTTGC CAAGAAGACC 
GACGACGTCG CCGGTGACGG CACCACCACC GCCACCGTGC TGGCCCAGGC GCTGGTCCGC 
GAGGGCCTGC GCAACGTGGC CGCCGGCGCC AACCCGATGG GTCTGAAGCG GGGCATCGAG 
AAGGCCGTCG AGGCCGTCTC CGCCCAGCTG CTCAAGGACG CCAAGGAGGT CGAGACCAAG 
GAGCAGATCG CGGCCACCGC CTCCATCTCC GCGGCCGACT CCTCCATCGG CGAGCTCATC 
GCCGAGGCGA TGGACAAGGT CGGCAAGGAA GGCGTCATCA CCGTCGAGGA GAGCAACACC 
TTCGGCCTCG AGCTCGAGCT CACCGAGGGC ATGCGCTTCG ACAAGGGCTA CACCTCGCTG 
TACTTCGCCA CCGACCAGGA GCGTCAGGAG GCCGTCCTCG AGGATCCCTA CATCCTGCTG 
TACGGCTCGA AGATCTCCTC GGTCAAGGAC CTGCTGCCGC TGCTGGAGAA GGTCATCCAG 
TCCGGCAAGG CCCTGCTGAT CATCGCCGAG GACGTCGAGG GCGAGGCCCT GGCGACCCTG 
GTGGTCAACA AGATCCGTGG CACCTTCAAG TCGGTTGCCG TCAAGGCCCC CGGCTTCGGT 
GACCGCCGCA AGGCCATGCT GCAGGACATC GCCATCCTCA CCGGTGGCCA GGTCATCAGC 
GAGGATGTCG GCCTCAAGCT GGAGAACACC GACCTGTCCC TGCTGGGTCA GGCCCGCAAG 
GTCGTCGTGA CCAAGGACGA GACCACCATC GTCGACGGTT CCGGCGATGC CGAGCAGATC 
GCCGGCCGGG TGGCCCAGAT CCGCTCCGAG ATCGAGAAGA GCGACTCGGA CTACGACCGC 
GAGAAGCTGC AGGAGCGGCT GGCCAAGCTG GCCGGCGGCG TTGCGGTCAT CAAGGCCGGA 
GCGGCCACCG AGGTGGAGCT CAAGGAGCGC AAGCACCGCA TCGAAGATGC CGTGCGCAAC 
GCCAAGGCTG CCGTGGAGGA GGGCATCGTC GCCGGTGGCG GCGTCGCCCT GCTGCAGGCC 
GCGATCGTGG CCTTCCAGGG CCTGGAGCTG ACCGGGGACG AGGCGACCGG CGCGAACATC 
GTGCGCGTGG CCGTCGAGGC TCCGCTCAAG CAGATCGCGA TCAACGCCGG CCTCGAGGGC 
GGCGTCGTGG CGGAGAAGGT CAAGGGTCTG CCCGCGGGCG AGGGCCTGGA CGCCGCCACC 
GGCGAGTACA AGGACCTGAT CAAGGCCGGC ATCATCGACC CGGCCAAGGT CACCCGGTCC 
GCGCTGCAGA ACGCCGCGTC CATCGCCGCG CTGTTCCTGA CCACCGAAGC CGTGGTCGCG 
GACAAGCCGG AGAAGGCCTC GGCGCCGGCC GGCGGCGGTA TGCCCGGCGG GGACATGGAC 
TTCTGA

Protein sequence

MAKLIAFDEE ARRGLERGMN TLADAVKVTL GPRGRNVVLE KKWGAPTITN DGVSIAKEIE 
LEDPYEKIGA ELVKEVAKKT DDVAGDGTTT ATVLAQALVR EGLRNVAAGA NPMGLKRGIE 
KAVEAVSAQL LKDAKEVETK EQIAATASIS AADSSIGELI AEAMDKVGKE GVITVEESNT 
FGLELELTEG MRFDKGYTSL YFATDQERQE AVLEDPYILL YGSKISSVKD LLPLLEKVIQ 
SGKALLIIAE DVEGEALATL VVNKIRGTFK SVAVKAPGFG DRRKAMLQDI AILTGGQVIS 
EDVGLKLENT DLSLLGQARK VVVTKDETTI VDGSGDAEQI AGRVAQIRSE IEKSDSDYDR 
EKLQERLAKL AGGVAVIKAG AATEVELKER KHRIEDAVRN AKAAVEEGIV AGGGVALLQA 
AIVAFQGLEL TGDEATGANI VRVAVEAPLK QIAINAGLEG GVVAEKVKGL PAGEGLDAAT 
GEYKDLIKAG IIDPAKVTRS ALQNAASIAA LFLTTEAVVA DKPEKASAPA GGGMPGGDMD 
F