Gene Mpal_0032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_0032
Symbol
ID	7270144
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	+
Start bp	30275
End bp	31930
Gene Length	1656 bp
Protein Length	551 aa
Translation table	11
GC content	59%
IMG OID	643568691
Product	thermosome
Protein accession	YP_002465151
Protein GI	219850719
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02339] thermosome, various subunits, archaeal

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.810485
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTCTCAAC AGCTTGCAGG ACAGCCAATC TTTATTCTTA AGGAAGGGAG TTCACGGACT 
CGTGGACGCG ACGCGCAGGG GAACAACATC AATGCAGCCA AGGCTGTTGC GAATGCAGTC 
AGGACCACGC TCGGACCAAA GGGCATGGAC AAGATGCTCG TCGACACCAT CGGTGATGTC 
GTAATCACCA ATGACGGTGT CACAATTCTC AAGGAGATGG ACATCGAGCA CCCGGCCGCA 
AAGATGATGG TCGAGGTCGC TAAGACCCAG GACGATGAAG TCGGTGACGG AACCACGACC 
GCTGTCGTGA TCGCCGGCGA ACTCTTAAAG CGTGCAGAAG ACCTTCTTGA CCAGGACGTT 
CACCCAACCG TGATCGCTCA CGGATACCGG ATGGCAGCAG AGAAGGCTCA GGAGATCCTC 
GCCGAGATTG CGATCCCGGT GAAGGCCACT GACCTCGCAA TGCTGAAGAA GATCTCAGAG 
ACCGCGATGA CCGGCAAGGG TGCAGAGGCT GCCAAGGACA AGCTCTGCGA CCTGGTCGTC 
AGGGCAGTCA CGATGGTCGC CGAAGAGGAT GGCACTGTCG ACAAGGACAA CATCAAGGTG 
GAGAAGAAGG TCGGCGGTTC GATCCAGGAC TCCGAGATCA TCGAGGGGAT GCTGATCGAC 
AAGGAACGCG TCCACCCAGG GATGCCAAAG AAGGTCGTCG GCGCGAAGAT TCTGCTCTTA 
AATGCAGCGG TCGAGTTCAA GAAGACCGAA GTCGATGCTG AGATCAACAT CACGAGCCCA 
GACCAGCTCC AGTCATTCCT CGACGAGGAA GAGCGGATGA TCCGGACCAT CGTCGAGAAG 
ATCATCGCCA GCGGCGCGAA CGTCCTCTTC TGTCAGAAGG GTATCGACGA CATTGCCCAG 
CACTACCTTG CGAAGGCAAA GATCTTCGGG GTCCGCCGTG TAAAGAAGAG CGACATGGAG 
AAGCTGGCCC GTGCGACCGG TGCCACCATG GTCTCTTCGA TCGACGCGAT CAGCAAGGAC 
GAGCTCGGCA CTGCAGGGCT CATCGAGGAG AAGAAGGTCT CCGGCGAAGA GATGATCTTC 
GTCACCGAGT GCTCCAACCC CAAGGCGGTC TCGATCATCG TCCGCGGTGG GACCGAGCAC 
GTCGTCGACG AGCTCGAGCG TGCGATGGAG GATGCTATCA GGGTCGTCTC CGTCGTCATC 
GAGGACAAGA AGCTGGTCGC CGGCGGCGGT TCACCAGAGA CCGAGCTCTC CCAGCGCCTG 
AAGATCTATG CGTCCAGCGT CGGTGGCCGC GCACAGCTCG CCATCGAAGC CTTCGCCAGC 
GCCCTTGAGA TCATCCCGAG GACCCTTGCG GAGAATGCAG GGCTCGACCC CATCGATATG 
CTCGTCGAGC TCCGTGCAGC CCATGAGAAG GGACAGAAGA CCGCAGGTCT CGATGTCTAC 
GAAGGCAAGG CAGGGGACAT GCTGGCAGCA GGGGTCATCG AGCCGCTGCG GGTCAAGACC 
CAGGCCATCT CCAGCGCTGC AGAGGCAGCT GTGATGATCC TCAGAATCGA CGATGTCATC 
GCATCGTCCA AGTCAGCAGC CCCAGAAGGC ATGCCACCAG GTGGAATGGG CGGCATGCCA 
CCGGGTATGG GCGGTATGGG TGGCATGGAC TACTGA

Protein sequence

MSQQLAGQPI FILKEGSSRT RGRDAQGNNI NAAKAVANAV RTTLGPKGMD KMLVDTIGDV 
VITNDGVTIL KEMDIEHPAA KMMVEVAKTQ DDEVGDGTTT AVVIAGELLK RAEDLLDQDV 
HPTVIAHGYR MAAEKAQEIL AEIAIPVKAT DLAMLKKISE TAMTGKGAEA AKDKLCDLVV 
RAVTMVAEED GTVDKDNIKV EKKVGGSIQD SEIIEGMLID KERVHPGMPK KVVGAKILLL 
NAAVEFKKTE VDAEINITSP DQLQSFLDEE ERMIRTIVEK IIASGANVLF CQKGIDDIAQ 
HYLAKAKIFG VRRVKKSDME KLARATGATM VSSIDAISKD ELGTAGLIEE KKVSGEEMIF 
VTECSNPKAV SIIVRGGTEH VVDELERAME DAIRVVSVVI EDKKLVAGGG SPETELSQRL 
KIYASSVGGR AQLAIEAFAS ALEIIPRTLA ENAGLDPIDM LVELRAAHEK GQKTAGLDVY 
EGKAGDMLAA GVIEPLRVKT QAISSAAEAA VMILRIDDVI ASSKSAAPEG MPPGGMGGMP 
PGMGGMGGMD Y