Gene Cthe_0344 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0344
Symbol
ID	4808493
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	432885
End bp	434057
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	43%
IMG OID	640105758
Product	malate dehydrogenase
Protein accession	YP_001036775
Protein GI	125972865
COG category	[C] Energy production and conversion
COG ID	[COG0281] Malic enzyme
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.318957
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATTACA GAAAAGAATC ACTAAGGCTT CACGGTGAGT GGAAGGGTAA AATTGAGGTT 
ATACACAAGG TACCTGTTTC AACCAAGGAA GAGTTGTCGC TTGCTTATAC ACCGGGTGTT 
GCAGAACCAT GTCTTGCAAT TCAGAAAGAT GTTAATCTTT CTTATGAATA TACAAGACGT 
TGGAACCTGG TAGCGGTTAT TACCGACGGT ACGGCGGTTT TAGGGCTCGG AGACATAGGA 
CCTGAAGCCG GAATGCCTGT TATGGAAGGT AAATGCGTAC TCTTCAAGAA GTTTGGTGAT 
GTGGACGCAT TTCCGCTCTG TATCAAATCA AAAGACGTAG ATGAAATTGT AAAGACAATC 
AAGCTCATCT CCGGAAGCTT TGGCGGTATA AACCTCGAAG ATATATCCGC TCCGAGATGC 
TTTGAAATAG AAAGAAGACT CAAAGAGGAA TGTGACATTC CAATATTCCA TGATGACCAG 
CACGGTACAG CCGTTGTTAC TGTTGCAGCA ATGATCAATG CATTAAAGCT TGTCAACAAG 
AAAATCGAGG ATATAGAAGT TGTTGTAAAC GGTTCAGGTG CTGCCGGCAT AGCTGTAACA 
AGACTGCTCA TGAGTATGGG GCTTAAGAAA GTTATCCTTT GCGATACCAA AGGTGCAATT 
TATGATGGAA GAGACAACTT AAACAGTGAA AAAGCCCTGA TTGCTAAAAT CTCGAACCTC 
GAGAAAAAGA AAGGTACTCT TGAAGATGTA ATCAAGGGAG CTGACGTATT CATCGGTCTT 
TCCGTTCCAG GAACAGTTAC AAAGGATATG GTAAAATCCA TGGCAAAGGA TCCGATTATC 
TTTGCTATGG CAAATCCTAC TCCTGAAATA ATGCCTGATG AAGCAAAAGA AGCAGGAGCA 
AAGGTAGTGG GTACCGGAAG ATCCGACTTC CCGAACCAGA TAAACAACGT TCTTGCGTTC 
CCCGGAATAT TCAGAGGTGC GCTTGATGTA AGAGCAAGAG ATATCAATGA TGAAATGAAG 
ATAGCCGCTG CAAAAGCAAT AGCTTCTCTG GTAAGCGATG AAGAGCTCAA TCCTGACTTC 
ATTCTTCCGC TCCCATTTGA CCCAAGAGTC GGAAAAACAG TTGCTGCAGC AGTTGCTGAA 
GCAGCAAGAA AAACCGGAGT TGCAAGAATA TAA

Protein sequence

MDYRKESLRL HGEWKGKIEV IHKVPVSTKE ELSLAYTPGV AEPCLAIQKD VNLSYEYTRR 
WNLVAVITDG TAVLGLGDIG PEAGMPVMEG KCVLFKKFGD VDAFPLCIKS KDVDEIVKTI 
KLISGSFGGI NLEDISAPRC FEIERRLKEE CDIPIFHDDQ HGTAVVTVAA MINALKLVNK 
KIEDIEVVVN GSGAAGIAVT RLLMSMGLKK VILCDTKGAI YDGRDNLNSE KALIAKISNL 
EKKKGTLEDV IKGADVFIGL SVPGTVTKDM VKSMAKDPII FAMANPTPEI MPDEAKEAGA 
KVVGTGRSDF PNQINNVLAF PGIFRGALDV RARDINDEMK IAAAKAIASL VSDEELNPDF 
ILPLPFDPRV GKTVAAAVAE AARKTGVARI