Gene Cthe_0394 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0394
Symbol
ID	4808397
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	489921
End bp	491090
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	43%
IMG OID	640105808
Product	iron-containing alcohol dehydrogenase
Protein accession	YP_001036825
Protein GI	125972915
COG category	[C] Energy production and conversion
COG ID	[COG1454] Alcohol dehydrogenase, class IV
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.394023
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGCAT TTAACTATTA TGCACCTACT GAAATTATTT TCGGATGCGG CAGAGTTCAG 
GAAATTGGAT CAATAACTGC CCAATATGGA AAGAAAGCTT TGCTGGTAAC TGTACCGGAA 
TTTCCGGAAG TAAAGGAGCT CTATGAAAAA GTAAAGAAGT CTCTTAGGGA AAATGGTGTG 
GAAGTAGTAC ATTTTGACGG TGTTATTCCA AATCCCACCA CTGATGTTGT AACTGAAGGA 
GCAAATATGG CAAAGGCTGC CGGGGTTGAT GTAGTTATTG GATTGGGAGG AGGTTCCTCA 
ATAGATACTG CAAAAGCCAT TGCAGTTGAA GCAACCCATC CGGGAACTGC CTGGGATTAT 
AACTGCCACA CTCCGGGCCC CACATCTGCT ACCCTCCCTA TTATCGCAAT AGGAACAACA 
GCAGGAACCG GCAGCCAGTG TACACAATGT GCAGTTATCA CAAAAACAAG TGAAAAGGAT 
AAATCCGCAA TTTGGCACAA AAATATTTTC CCTAAAGTTG CGATAGTTGA TCCCGAAGTG 
ACAGTCACGA TGCCCAAAAG TGTAACTGCG CAGACCGGTT TTGACGCTTT TGCCCATAAC 
TTTGAAGCAT ATCTTTCCGT GAAAACCAGT CCGTTAGTTG AGATGATGGC AATAGAAGCA 
ATAAAGATGA TTAAGGAATA TTTGCCAAAA GCTTTGGAGA ATCCAAACGA CATTGAGGCA 
CGGTCAAAGA TGTCATTGGC TGACACTTTG GGTGGACTTA CCAATTCCAA CGCAGGAGTA 
ACACTGCCCC ATGGGTTGGG AATGCAAGTC GGCGGCCATG CTCCCCATGT ATCCCACGGA 
CAGGCTTTGG CGATAATATA TCCTCAATTT ACAAGGTACA CATACGCCTG GGCAATTGAA 
AAGTTCGCCA AGGTTGGAAG AATATTTAAT CCTGCATTGA ATGAACTTTC CGATGAAGAA 
GCGGCAAAAG AAGCGTGTGT GGCAATTGAT GATTTCCTGA AGAAAATAGG TTTGTGGATT 
GGTTTTAAAG ATGTGAATGT TACGAAAGAG CAAATTCGTG AAATAGCAGA TGATGGTCAG 
GTTTTAGGTG ATTACCTCAA CAATCCTCGT GTAGCAACGA TTGATGAGAT GTACGAGCTA 
CTGATGAATT GCTATGAGCG CAAAGAATGA

Protein sequence

MKAFNYYAPT EIIFGCGRVQ EIGSITAQYG KKALLVTVPE FPEVKELYEK VKKSLRENGV 
EVVHFDGVIP NPTTDVVTEG ANMAKAAGVD VVIGLGGGSS IDTAKAIAVE ATHPGTAWDY 
NCHTPGPTSA TLPIIAIGTT AGTGSQCTQC AVITKTSEKD KSAIWHKNIF PKVAIVDPEV 
TVTMPKSVTA QTGFDAFAHN FEAYLSVKTS PLVEMMAIEA IKMIKEYLPK ALENPNDIEA 
RSKMSLADTL GGLTNSNAGV TLPHGLGMQV GGHAPHVSHG QALAIIYPQF TRYTYAWAIE 
KFAKVGRIFN PALNELSDEE AAKEACVAID DFLKKIGLWI GFKDVNVTKE QIREIADDGQ 
VLGDYLNNPR VATIDEMYEL LMNCYERKE