Gene Cthe_2393 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2393
Symbol
ID	4811045
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	2858204
End bp	2859139
Gene Length	936 bp
Protein Length	311 aa
Translation table	11
GC content	44%
IMG OID	640107806
Product	thiamine pyrophosphate enzyme-like TPP-binding
Protein accession	YP_001038788
Protein GI	125974878
COG category	[C] Energy production and conversion
COG ID	[COG1013] Pyruvate:ferredoxin oxidoreductase and related 2-oxoacid:ferredoxin oxidoreductases, beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00141499
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTTATA ATTTGAAAGA AGTTGCAAAA AAACCGGAAA GACTTACGGG CGGACACAGA 
ATGTGTGCAG GCTGCGGAGC TCCGATAGTT GTAAGACAGG TTCTTAAGGC ATTAAAACCG 
GAAGATCATG CGGTTATCTC AGCTGCAACA GGTTGTTTGG AAGTTTCAAC TTTCATTTAC 
CCTTATACAG CATGGAAGGA TTCTTTCATT CACAGTGCGT TTGAAAATAC CGGTGCTACA 
ATTTCCGGTG CGGAAGCGGC TTATAAAGTA TTGAAGAAAA AAGGAAAAAT TGAAGGGGAG 
ACCAAGTTTA TTGCGTTCGG TGGTGACGGC GGAACATACG ACATAGGACT TCAGGCACTC 
TCAGGAGCGA TGGAAAGAGG ACACGACATG GTTTATGTGT GCTACGACAA TGGAGCATAC 
ATGAACACAG GTATCCAGAG GTCTTCTGCC ACTCCGAAAT ACGCTGATAC CACAACTTCA 
CCTGTTGGAA AGAAGATACC CGGTAAAATG CAGCCAAGAA AAGACCTGAC AGAAGTATTG 
GTAAATCATC GCATACCTTA TGTTGCTCAA ACCGCTCCTT TCGGGAACAT GAAGGACCTC 
TATGAAAAAG CTGAAAAAGC TATTTATACA CCCGGTCCTG CGTTCCTGAA CGTGTTGGCA 
CCGTGCCCGA GAGGATGGAG ATACAACACT CCTGATTTGA TGGAATTGAG CAAATTGGCG 
GTTGAAACTT GCTTCTGGCC GCTTTATGAA GTAATTGACG GCAAATATAT AATAAACTAC 
AAGCCGAAGG AAAAAGTTCC CGTCAAGGAA TTCTTGAAAC TTCAGGGAAG ATTTAAACAT 
CTTTTCAAAG CCGGCAACGA ATATATGCTG GAAGAAATTC AGAAAGAAGT CGACTTAAGA 
TGGGAGAGAC TCTTGAAGCT GGCCGGAGAG GCTTAA

Protein sequence

MAYNLKEVAK KPERLTGGHR MCAGCGAPIV VRQVLKALKP EDHAVISAAT GCLEVSTFIY 
PYTAWKDSFI HSAFENTGAT ISGAEAAYKV LKKKGKIEGE TKFIAFGGDG GTYDIGLQAL 
SGAMERGHDM VYVCYDNGAY MNTGIQRSSA TPKYADTTTS PVGKKIPGKM QPRKDLTEVL 
VNHRIPYVAQ TAPFGNMKDL YEKAEKAIYT PGPAFLNVLA PCPRGWRYNT PDLMELSKLA 
VETCFWPLYE VIDGKYIINY KPKEKVPVKE FLKLQGRFKH LFKAGNEYML EEIQKEVDLR 
WERLLKLAGE A