Gene Namu_1208 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_1208
Symbol
ID	8446804
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	1326457
End bp	1328088
Gene Length	1632 bp
Protein Length	543 aa
Translation table	11
GC content	71%
IMG OID	645040344
Product	chaperonin GroEL
Protein accession	YP_003200603
Protein GI	258651447
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.730524
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAAGC AGATCCGCTT CGATACCGAC GCGCGCGCGG CCCTGCAGCG CGGCGTCGAC 
AAGCTCGCCG ACGCGGTGAA GGTCACCCTT GGGCCGCGCG GCCGGTACGT GGTGCTGGAC 
AAGAAGTTCG GCGGCCCGAC CATCACCAAT GACGGCGTCA CCATCGCTCG CGACATCGAG 
CTGGACGACC CGAACGAGAA CATGGGCGCG CAGCTGGCCA AGACCGCGGC GACCAAGACC 
AACGACGTGG CCGGCGACGG CACCACGACC GCGACCATCC TGACCCAGGC GATGATCGCC 
GAGGGCCTGC GCAACGTCAC CGCCGGGGCG AACCCGCTGG CGCTGCGCTC GGGCATCACC 
CAGGCCGCCG ACCGGGTCAA CGAGCTGCTC ACTGAGTGGG CGACCCCGGT GGCCGGCGAC 
CGCGAGGCCA TCGCCCAGGT CGGCACCATC GCCTCCCGCG ACGAGGTGAT CGGCGACCTG 
CTGGGCGATG CCCTGCAGCA CGTCGGCGCC GACGGCGTGG TCAGCGTCGA GGAGCACTCC 
GGGCTGACCA CCGAGCTCGA GTACACCGAC GGCGTGCAGT TCGACAAGGG CTACCTCTCG 
CCGTACTTCG CGACCGACCC GGAGGCCGCC GAGGCCGTCC TGGAGGACGC GCTGGTGCTG 
CTGGTGCGTG AGAAGATCTC CGCCCTGGCC GACCTGCTCC CGCTGCTGGA GAAGGTGCTG 
GAGGCCAAGA AGCCGCTGCT GATCGTGGCC GAGGACGTCG ACGGCGAGGC GCTGTCCACC 
CTGGTGGTCA ACGCCATCCG CAAGACGTTC ACCGTCGTCG CGGTCAAGGC GCCGTTCTTC 
GGCGACCGGC GCAAGGCCTT CCAGCAGGAC CTGGCCATCG TCACCGGGGC CGAGGTCGTC 
TCCGCCGAGG TCGGTCTCAA GCTGGCCGAG GTCGGCACCG AGGTGCTGGG CCGGGCCCGG 
CGCATCACCG TCACCAAGGA CACGACCACG ATCGTGGACG GCGGCGGCTC GGCCGAGGCG 
GTGGCCGATC GGGCCGCGCA GCTGCGGGCC GACATCGAGA GCACCGATTC GGACTGGGAT 
CGGGAGAAGC TGCAGGAGCG GCTGGCCAAG CTGGCCGGTG GCGTGGCGCT GATCAAGGTC 
GGCGCGGCCA CCGAGATCGA GGCCAAGGAG CGCAAGCACC GCATCGAGGA CGCGGTCAAC 
GCGACCAAGG CGGCGGTGGC CGAAGGCATC ATCGCCGGCG GTGGATCCGC GCTGGTGCAC 
GCCTCGGCCG CGCTGGCCGA GCTGCAGGAG CAGCTGTCCG GCGACGAGGC GCTCGGCGTC 
GGCATCGTTC GGCGCGCGCT GTCCGCCCCG GCCTTCTGGA TCGCCGCCAA CGGTGGCCAG 
GAGGGCGCCG TCGTGGTCAA CCGCATCGCG GATCTGCCGC GGGGCGAGGG CTATGACGCC 
GGCCAGGACC GGTATGTCGA CCTGGTGCAG GCCGGCATCA TCGACCCGGT CAAGGTGACC 
AAGTCGGCCG TGTCCAACGC TGCGTCGATC GCCGGCATGG TGCTGACCAC CGAGTCGACC 
GTCGTCGACC TCCCGGAGGA CCAGCACGAC CACGGCGCTG ACGGCCACGG CCACCACGGC 
CACAGCCACT GA

Protein sequence

MAKQIRFDTD ARAALQRGVD KLADAVKVTL GPRGRYVVLD KKFGGPTITN DGVTIARDIE 
LDDPNENMGA QLAKTAATKT NDVAGDGTTT ATILTQAMIA EGLRNVTAGA NPLALRSGIT 
QAADRVNELL TEWATPVAGD REAIAQVGTI ASRDEVIGDL LGDALQHVGA DGVVSVEEHS 
GLTTELEYTD GVQFDKGYLS PYFATDPEAA EAVLEDALVL LVREKISALA DLLPLLEKVL 
EAKKPLLIVA EDVDGEALST LVVNAIRKTF TVVAVKAPFF GDRRKAFQQD LAIVTGAEVV 
SAEVGLKLAE VGTEVLGRAR RITVTKDTTT IVDGGGSAEA VADRAAQLRA DIESTDSDWD 
REKLQERLAK LAGGVALIKV GAATEIEAKE RKHRIEDAVN ATKAAVAEGI IAGGGSALVH 
ASAALAELQE QLSGDEALGV GIVRRALSAP AFWIAANGGQ EGAVVVNRIA DLPRGEGYDA 
GQDRYVDLVQ AGIIDPVKVT KSAVSNAASI AGMVLTTEST VVDLPEDQHD HGADGHGHHG 
HSH