Gene Cthe_1379 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1379
Symbol
ID	4809374
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	1683369
End bp	1684457
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	40%
IMG OID	640106803
Product	oxidoreductase-like protein
Protein accession	YP_001037804
Protein GI	125973894
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAA TTCGTCTTGC TGTAATAGGT ACGGGAATGG CCTGGGAAAG ACTTCATTAT 
CCTGCCATTA AAGAACTTGA AGACAAATAT GAAATAGTTG CGTTGTGCAA TCGGACCCGC 
AAGGATGCCG AAGAATTTGC GAAAAAAATA AACTTAAGCA TGGACAGGGT TTACGATGAT 
TACAATGAAA TGCTCAAAAG ACAGGATATA GATGCAGTAG ATATCCTTGT GCCTATTGAA 
TCCAACTATA CGGTTTCGGA AGCCGTTGCA AAAGCCGGCA AGGACTTTAT TTGTGAAAAA 
CCTCTTGCTG CAAACAGGGA AGAGGCAAAA AAATATCTGG AACTTTCAAA AAAATACAAT 
GTAAGAATCA TGATAGCCGA AAACTACAGA TACAGCGACG AGTACAACAA AATCAGGGAT 
ATAGTAAACA GCGGAAAAAT CGGGGATGTG GTATACTTTA TAAAAAACAA CATATCCTGC 
TTCCCCTGTG AAATGACAAA AGATACCTTC GCCGCCACCG AATGGAGACA GCATCCCAAA 
TTCTACGGAG GTGCTTTTTT GGACGCAGCA GTGCATGATA TTGCGGCAAT GAGGCATATT 
TTCGGTGCGG TTGAATGTGT ACAGGCTTTT GGAAAACCAC AGGCAGAAGA TTTCAATCCG 
TATGTGTCAG TAAACGCTCA TATTCTCTTT AAAAACGGAG TCATAGGGTA TTATACGTAC 
TATCCTTCGG GCATTGAAAC TCAAAAGCCG GCGGTAGGCT TTAGAATCTT CGGCACCAAA 
GGCGAAATAT ATCTTGAAGA CAAGACATGC GGAATAATAA ACGTGTCATA TCATGACGGT 
ACTTCGGAAC TTGTAAACTT TATTCCCGAA CGGGGCTTTT ACAACGAACT TTTAAATTAC 
TACAACGCCA TAAACGGTAC GGAACAAATA TCTGTAACCC CTGAGATGGA ATATGGGGAT 
GTCAAAATGG TTTTTGACAT TTTGGACTCT GTATCCTTCC GGGAAATCAT ATATGTGGAT 
GAAGAAGAAC CAAAAAGGCG GCTGGAAATT GCCGATGATG AAGCAAAAAT ACATCCTTTC 
CTTCAGTAA

Protein sequence

MKKIRLAVIG TGMAWERLHY PAIKELEDKY EIVALCNRTR KDAEEFAKKI NLSMDRVYDD 
YNEMLKRQDI DAVDILVPIE SNYTVSEAVA KAGKDFICEK PLAANREEAK KYLELSKKYN 
VRIMIAENYR YSDEYNKIRD IVNSGKIGDV VYFIKNNISC FPCEMTKDTF AATEWRQHPK 
FYGGAFLDAA VHDIAAMRHI FGAVECVQAF GKPQAEDFNP YVSVNAHILF KNGVIGYYTY 
YPSGIETQKP AVGFRIFGTK GEIYLEDKTC GIINVSYHDG TSELVNFIPE RGFYNELLNY 
YNAINGTEQI SVTPEMEYGD VKMVFDILDS VSFREIIYVD EEEPKRRLEI ADDEAKIHPF 
LQ