Gene Cthe_0140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0140
Symbol
ID	4808698
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	177383
End bp	178918
Gene Length	1536 bp
Protein Length	511 aa
Translation table	11
GC content	43%
IMG OID	640105551
Product	phosphoglyceromutase
Protein accession	YP_001036574
Protein GI	125972664
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0696] Phosphoglyceromutase
TIGRFAM ID	[TIGR01307] 2,3-bisphosphoglycerate-independent phosphoglycerate mutase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0674113
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGACA AACTTGTGAT GTTGATTATT TTGGATGGTT ATGGTATTAA TCCGAGAAAA 
GAGGGAAATG CCATAGAGGC TGCAAATAAA CCGAATATTG ACAGGTTTAT GAGGGAATAT 
CCCAATACAA TAGTTCGTAC CAGCGGTATG GATGTGGGAC TTCCCGACGG TCAGATGGGC 
AATTCCGAAG TAGGGCATAC CAATATTGGT GCAGGAAGAA TTGTATATCA GGAACTTACA 
AGGATAACCA AATCCATTCA GGACGGAGAC TTTTTTGAGA AGAAAGAATT TTTGGATGCT 
GCCGAAAACT GCAGAAAGCA CAATTCAAAG CTGCATCTCT TCGGACTTCT TTCTGACGGC 
GGCGTGCACA GCCACAATAC CCACCTGTAT GGCCTCTTGG AGTTTGCAAA AAGGCAGAAT 
TTGAAAGATG TGTATGTTCA TTGCTTCTTT GACGGCAGGG ACGTTCCGCC GGACAGTGCA 
ATGGGCTATG TGGAAGAGCT TGAAAATAAA ATCAGGGAAA TCGGCGTAGG TGAAATTGCC 
ACAGTTATGG GAAGATACTA CGCCATGGAC CGTGACAACA GATGGGAGAG AGTAAAACTT 
GCCTATGATG CCATGGTTCT TGGAAGAGGA AATCAAGCCC AAAGTGCAAA AGAGGCGGTT 
GCAGAATCTT ATAAAAGACA AGAGTTCGAT GAATTTGTAA AACCCACAGT TATAATGAAA 
AACGGCTCTC CGGTGGCTAC TGTCGGGGAA AACGACTCTA TAATATTCTT TAACTTCAGG 
CCTGACAGAG CCAGAGAAAT TACCAGGGCT TTCACGGAGG TCAATTTTTC AGGTTTTGAA 
AGGGAAAAAG GATATTTTCC GGTGTTCTTT GTCTGCATGA CCCAGTATGA CAAAACTTTT 
GAAAACGTTG TTGTGGCATT TAAGCCTGAA AGCCTTGAGA ATACCTTTGG AGAGTATATC 
AGCAAGAAAG GGCTGAGACA GCTTAGAATT GCCGAAACGG AAAAATATGC CCATGTAACC 
TTCTTCTTTA ACGGAGGTGT TGAGGCGGTA TACGAAGGAG AAGACAGGAT ATTGATAAAT 
TCTCCGAAAG TTGCAACATA TGATTTGAAG CCTGAAATGA GTGCCTACGA GGTAACTGAC 
AAGGTGCTTG AGTGCATAAA TAAAAAGGAA TATGATGTAA TAATATTAAA TTATGCAAAT 
CCCGACATGG TGGGGCATAC CGGAGTGTTT GAGGCGGCAA AGGCTGCAAT TGAAGCCATT 
GACGAATGTT TGGGCAAGGT TGTTCCCGCA GTGCTTGAGC AAAACGGAGT GGTATTGATA 
ACCGCGGATC ACGGAAATTC CGAGCAGATG ATAGATTATG AAACCGGAGG ACCTTTCACG 
GCACATACAA CAAATCCTGT TCCTCTCATT GTCATTGGCC TTGGAGATGT CAAGCTCAGA 
GAAGGAAGGC TTGCGGACCT TGCGCCGACA ATGCTTGATA TTTTAGGATT TGAGAAGCCT 
AAGGAAATGA CAGGGGAATC GTTGATTGTA AAATAA

Protein sequence

MKDKLVMLII LDGYGINPRK EGNAIEAANK PNIDRFMREY PNTIVRTSGM DVGLPDGQMG 
NSEVGHTNIG AGRIVYQELT RITKSIQDGD FFEKKEFLDA AENCRKHNSK LHLFGLLSDG 
GVHSHNTHLY GLLEFAKRQN LKDVYVHCFF DGRDVPPDSA MGYVEELENK IREIGVGEIA 
TVMGRYYAMD RDNRWERVKL AYDAMVLGRG NQAQSAKEAV AESYKRQEFD EFVKPTVIMK 
NGSPVATVGE NDSIIFFNFR PDRAREITRA FTEVNFSGFE REKGYFPVFF VCMTQYDKTF 
ENVVVAFKPE SLENTFGEYI SKKGLRQLRI AETEKYAHVT FFFNGGVEAV YEGEDRILIN 
SPKVATYDLK PEMSAYEVTD KVLECINKKE YDVIILNYAN PDMVGHTGVF EAAKAAIEAI 
DECLGKVVPA VLEQNGVVLI TADHGNSEQM IDYETGGPFT AHTTNPVPLI VIGLGDVKLR 
EGRLADLAPT MLDILGFEKP KEMTGESLIV K