Gene Cthe_0101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0101
Symbol
ID	4808725
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	133120
End bp	134289
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	45%
IMG OID	640105510
Product	iron-containing alcohol dehydrogenase
Protein accession	YP_001036535
Protein GI	125972625
COG category	[C] Energy production and conversion
COG ID	[COG1979] Uncharacterized oxidoreductases, Fe-dependent alcohol dehydrogenase family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0640895
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAAACT TTGTTTATAA AAATCCAACG AAGATAATAT TTGGCAGAGG TACTGAATTG 
AAAGTCGGAG AAGAAGTCAG ACAATACAGT GGGAAAGTAT TGCTTCATTA TGGTGGAGGC 
AGCATAAAGA AGACCGGTTT ATACGATAGA GTGGTTAATT CCCTGAAACA GGCAGGAGTT 
GAAGTGGTTG AGCTTGGAGG AGTCATGCCC AATCCGAGGC TTGGCCTTGT AAACGAGGGA 
ATAAAAATTT GCCGCGAAAA AGGAATTGAC TTTATTCTGG CGGTAGGCGG AGGAAGTGCC 
ATTGATTCGG CAAAGGCTAT AGCAGTGGGA GTGCCGTATG ACGGCGACGT ATGGGACTTT 
TTCTGTGGCA AGGCCGAACC GAAAGAAGCC CTTCCTGTAG GTGTGGTTTT GACCATACCT 
GCTGCGGGAA GTGAAGCAAG CCCAAATTCT GTAATAACCA GGGAAGACGG CCTGTACAAA 
CGGGGAATGT ACTCTGAGCT GATAAGGCCG GTATTTGCCA TTATGAATCC TGAATTGACC 
TATACGCTTC CTGCATATCA GACTGCGTGC GGTACTGCTG ATATCATGGC GCATATAATG 
GAAAGGTATT TTACAAACGA AACCCATACA GATTTAACAG ACCGTCTTTG CGAGGCTACG 
CTCAAAACAA TGATTAAGAA CGTGCCTATT GCTTTGGAAG AGCCGGACAA TTATAATGCA 
AGGGCGGAGA TTATGTGGGC AGGTACAATT GCGCACAACG GGCTTTTGGG AACCGGAAGA 
ATTGAGGACT GGGCATCCCA TAATATTGAG CATGAAATCA GCGCGATTTA CGATGTGGCA 
CACGGAGCCG GCCTTGCAGT GGTGTTCCCG GCGTGGATGA AATATGTTTA CAAAAACAAT 
TTGGACCGTT TTGTGCAGTT TGCCGTAAGA GTGTGGAATG TGGAAATGAA TTTTGACGAG 
CCGGAAAGGA CGGCTCTGGA AGGTATAGAA CGGCTGAAAA AGTTCTTTAA AGAAATAGGT 
CTTCCGGTTT CTTTGAAAGA AATGAACATA GGCGATGACA GGCTGGAAGA AATGGCGTCA 
AAATGCACGA ACGGAGGAAA AGCTACAATC GGAAATTTTG TAAAACTCAA TCGTGAAGAT 
GTGTACAATA TTTTAAAGCT GGCAGTGTAA

Protein sequence

MINFVYKNPT KIIFGRGTEL KVGEEVRQYS GKVLLHYGGG SIKKTGLYDR VVNSLKQAGV 
EVVELGGVMP NPRLGLVNEG IKICREKGID FILAVGGGSA IDSAKAIAVG VPYDGDVWDF 
FCGKAEPKEA LPVGVVLTIP AAGSEASPNS VITREDGLYK RGMYSELIRP VFAIMNPELT 
YTLPAYQTAC GTADIMAHIM ERYFTNETHT DLTDRLCEAT LKTMIKNVPI ALEEPDNYNA 
RAEIMWAGTI AHNGLLGTGR IEDWASHNIE HEISAIYDVA HGAGLAVVFP AWMKYVYKNN 
LDRFVQFAVR VWNVEMNFDE PERTALEGIE RLKKFFKEIG LPVSLKEMNI GDDRLEEMAS 
KCTNGGKATI GNFVKLNRED VYNILKLAV