Gene Cthe_0217 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0217
Symbol	pgi
ID	4808635
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	265432
End bp	266778
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	43%
IMG OID	640105630
Product	glucose-6-phosphate isomerase
Protein accession	YP_001036651
Protein GI	125972741
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0166] Glucose-6-phosphate isomerase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAGAA TAAAATTTGA CTATTCAAAA GCATTGCCTT TTGTAAGTGA ACGTGAAGTT 
GCATATTTCG AGAATTTTGT AAGGTCTGCC CATGACATGC TCCATAACAA AACCGGAGCG 
GGAAATGACT TTGTAGGCTG GGTTGATCTT CCTGTAAATT ATGACAGGGA AGAATTTGCG 
AGAATCAAGG CTGCGGCAGA AAAGATAAAA TCTGATTCTG ATGCTTTGGT TGTAATTGGA 
ATCGGAGGTT CCTATCTGGG AGCAAGGGCG GCAATAGAGA TGCTTTCCCA CTCATTCCAC 
AATCTCATGC CCAAATCAAA GAGGAATGCT CCTGAGATAT ATTTTGTGGG AAACAATATC 
AGCTCTACAT ACATTGCTGA TTTGCTGGAA GTAATAGAAG GCAAAGAGAT TTCGGTAAAC 
GTTATATCAA AATCCGGTAC TACAACGGAG CCTGCCATTG CTTTCAGAAT CTTTAAAGAG 
TACATGGAAA ACAAATACGG AAAAGACGGA GCAAGTAAAA GAATATATGC CACTACCGAC 
AAGGAGAAAG GAGCACTCAG GAAGCTGGCA ACCGAAGAGG GATATGAAAC ATTTGTAGTT 
CCTGATGACA TAGGTGGAAG ATTCTCCGTT CTGACGGCAG TTGGCTTGCT TCCCATTGCA 
GTGGCCGGAA TTGACATCGA CAGCATGATG AAGGGAGCTG CTGACGCCCG TGAGCTTTAC 
AGCAATCCAA ACCTGATGGA AAACGACTGC TACAAATATG CGGCTGTAAG AAACGCTCTC 
TACAGAAAGA ACAAGACAAT TGAGATAATG GTAAACTATG AACCTTCACT CCATTACTTC 
ACAGAATGGT GGAAACAGCT CTACGGAGAA AGTGAAGGAA AGGATCAAAA AGGTATATTC 
CCGGCCGGAG TTGACTTCAC TACGGACCTT CATTCCATGG GACAGTATAT ACAGGATGGA 
CTCAGGAACA TATTTGAAAC GGTAATCAGG GTTGAAAAGC CCAGAAAGAA TATTGTTATA 
AAGGAAGAAA AGGACAACCT TGACGGATTG AACTTTATTG CCGGAAAAGA CGTGGACTAT 
GTAAACAAGA AAGCAATGGA AGGAACGGTA CTTGCCCATA CCGACGGCGG TGTTCCGAAT 
CTTGTGGTAA CCGTGCCTGA GCTTAGTGCT TATTACTTTG GAAATATGGT ATACTTCTTT 
GAAAAAGCCT GCGGTATAAG CGGATACCTC CTTGGTGTAA ATCCTTTTGA CCAGCCGGGA 
GTTGAGGCTT ACAAGAAAAA CATGTTTGCC CTTCTTGGAA AACCGGGATA TGAAGAACAA 
AGAAAGAAAC TTGAAGAGCG TTTGTAA

Protein sequence

MERIKFDYSK ALPFVSEREV AYFENFVRSA HDMLHNKTGA GNDFVGWVDL PVNYDREEFA 
RIKAAAEKIK SDSDALVVIG IGGSYLGARA AIEMLSHSFH NLMPKSKRNA PEIYFVGNNI 
SSTYIADLLE VIEGKEISVN VISKSGTTTE PAIAFRIFKE YMENKYGKDG ASKRIYATTD 
KEKGALRKLA TEEGYETFVV PDDIGGRFSV LTAVGLLPIA VAGIDIDSMM KGAADARELY 
SNPNLMENDC YKYAAVRNAL YRKNKTIEIM VNYEPSLHYF TEWWKQLYGE SEGKDQKGIF 
PAGVDFTTDL HSMGQYIQDG LRNIFETVIR VEKPRKNIVI KEEKDNLDGL NFIAGKDVDY 
VNKKAMEGTV LAHTDGGVPN LVVTVPELSA YYFGNMVYFF EKACGISGYL LGVNPFDQPG 
VEAYKKNMFA LLGKPGYEEQ RKKLEERL