Gene Cthe_0677 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0677
Symbol
ID	4810295
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	832702
End bp	833868
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	44%
IMG OID	640106094
Product	phosphopentomutase
Protein accession	YP_001037105
Protein GI	125973195
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1015] Phosphopentomutase
TIGRFAM ID	[TIGR01696] phosphopentomutase

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGAG CTATAATAAT CGTTTTGGAC AGTGTTGGCA TGGGAGAGCT TCCCGATGCG 
GCAAAATACG GTGACGAAGG CAGCAACACA TTAGGAAATA TTGCAAAGAA TTTACCTGAT 
TTTAGTCTGC CAAATCTTGA GTCTTTGGGA TTGGGAAATA TTGACGGTAT GACAGGCTAT 
GAGCCTTCAA AAAATCCTTT AGGCTCTTAC GGAAGAATGG CGGAAAAATC CGCGGGCAAG 
GACACAACAA CAGGTCATTG GGAGATTGCC GGCCTGATAT TGGATAAGCC TTTTCCGGTA 
TATCCAAACG GATTTCCCGA AGATATAATA AAAAGATTCG AAGACAGTAT AGGAACAAAG 
ACATTGGGAA ATGTTCCGGC ATCGGGGACA GAGATAATCA AGCTGTTAGG AGATGAGCAT 
GTAAAGACAG GCTATCCAAT CGTGTACACA TCGGCCGACA GTGTGTTTCA AATAGCAGCC 
CATGAGAATG TAATACCCGT GGAGAGGCTC TATGACATGT GCCGGACGGC ACGAAACATT 
CTTACCGGAG AACATGCGGT CGGACGGGTA ATTGCAAGGC CTTTCATCGG CGAGTCGGGA 
AACTACAAAA GAACCGACAG AAGGAAAGAT TTTTCTCTTG CTCCTGTAGG AAAAACACTT 
TTGGACTATG CAGTTGAAAA TGGTTACAAA GTCAAGGCAG TCGGAAAGAT TGAGGATATA 
TTTGGCGGAA GAGGTATTAC CGAGTCAGTC CACATTCACG ACAACATGGA TGGAGTGGAC 
AGGACCCTTG AGTATATGAG GGATGATTTT GAAGGTATTC TTTTTACAAA TCTTGTGGAC 
TTTGACATGC TTTACGGGCA TCGCAACGAT ATTGCCGGTT ATGCCAATGC TTTGAAAGAG 
TTTGACCGAA GGATTCCGGA AATATTGGCA AATTTGCGGG AAGATGACCT TCTTGTTATA 
ACTGCAGATC ACGGCTGTGA CCCATCCACG GAAAGTACCG ATCATTCAAG AGAATATGTG 
CCTTTACTTG TATACGGAAA GAAGTTTAAA AGCAATGTAA ACTTAGGTAC GAGAAGCACC 
TTTGCGGATG TTGCAAAAAC TGTGGCCCAC TATCTTGGAA TCAGCAGCAA TTTAGAGGGA 
GAAAGCTTTC TTGGAAGCAT ACTGTAA

Protein sequence

MKRAIIIVLD SVGMGELPDA AKYGDEGSNT LGNIAKNLPD FSLPNLESLG LGNIDGMTGY 
EPSKNPLGSY GRMAEKSAGK DTTTGHWEIA GLILDKPFPV YPNGFPEDII KRFEDSIGTK 
TLGNVPASGT EIIKLLGDEH VKTGYPIVYT SADSVFQIAA HENVIPVERL YDMCRTARNI 
LTGEHAVGRV IARPFIGESG NYKRTDRRKD FSLAPVGKTL LDYAVENGYK VKAVGKIEDI 
FGGRGITESV HIHDNMDGVD RTLEYMRDDF EGILFTNLVD FDMLYGHRND IAGYANALKE 
FDRRIPEILA NLREDDLLVI TADHGCDPST ESTDHSREYV PLLVYGKKFK SNVNLGTRST 
FADVAKTVAH YLGISSNLEG ESFLGSIL