Gene Cthe_0152 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0152
Symbol
ID	4808640
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	191736
End bp	192683
Gene Length	948 bp
Protein Length	315 aa
Translation table	11
GC content	41%
IMG OID	640105563
Product	aldo/keto reductase
Protein accession	YP_001036586
Protein GI	125972676
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases) [COG2221] Dissimilatory sulfite reductase (desulfoviridin), alpha and beta subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.145765
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAAATATT GCAAATTGGG TAATACGGGT TTGGAAGTTT CGAAACTTTG CTTTGGCGGA 
CTTATAATCG GGCCTCTTCA GGCAAATCTC CCCCCGGAGA CTGGAGCCGA AATAATTTTA 
AAGTCTTTTG AGCTTGGCGT AAATTTTATC GATACGGCAG AGCTTTACGG CACTTATTCC 
CATATCGGAA AGGCACTTAA AAAGACAAAT AAAAATATCG TGGTTGCAAC CAAATCCTAT 
GCCTATTCTG CCGAAGGAGC AAAAGAAAGT CTGGAAAAAG CCAGAAAAGA AATGGATATT 
GATGTGATAG ACATTTTTAT GCTTCACGAA CAGGAAAGCA GGCTTACCTT AAAAGGACAC 
AGAGAGGCTT TGGAATATTA TATTTCCATG AAAGAAAAGG GAATAATAAA AGCGGTTGGA 
GTATCAACCC ACAATGTTGA GGTTGTGGAA GCCTGTTGTG AGATGCCGGA GGTTGACGTA 
ATACATCCCA TAGTAAACAA GGCGGGTATT GGAATAGGAG ACGGTACAAT AGACGACATG 
TTAAAGGCCG TTGAAAAGGC TTATTCGGTG GGAAAAGGAA TATACAGCAT GAAGCCTTTG 
GGAGGAGGCA ACCTGATTAA ATCCTATAAA GAAGCCATGG ATTTTGTACT TAATATTCCG 
TATATACATT CCATAGCGGT AGGTATGCAG TCAATAGAAG AGGTTGTTAT GAATGTATGC 
ATATTTGAGG GCAAAGAAGT ACCTCAAGAT GTCCAAAAAA GCCTTGAGAA CAAAAAAAGA 
CATCTTCATA TTGACTGGTG GTGCGAAGGC TGCGGAAAAT GCGTGGAAAG ATGCAAGCAG 
AAGGCTTTGA AGTTAGTTGA CGGAAAAGCA AAAGTCGAGG AGGAAAAATG TGTGTTGTGC 
AGCTACTGTG CGTCGGTATG TCCTGTGTTT GCCATCAAAG TATCGTAA

Protein sequence

MKYCKLGNTG LEVSKLCFGG LIIGPLQANL PPETGAEIIL KSFELGVNFI DTAELYGTYS 
HIGKALKKTN KNIVVATKSY AYSAEGAKES LEKARKEMDI DVIDIFMLHE QESRLTLKGH 
REALEYYISM KEKGIIKAVG VSTHNVEVVE ACCEMPEVDV IHPIVNKAGI GIGDGTIDDM 
LKAVEKAYSV GKGIYSMKPL GGGNLIKSYK EAMDFVLNIP YIHSIAVGMQ SIEEVVMNVC 
IFEGKEVPQD VQKSLENKKR HLHIDWWCEG CGKCVERCKQ KALKLVDGKA KVEEEKCVLC 
SYCASVCPVF AIKVS