Gene Cthe_0285 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0285
Symbol
ID	4808568
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	352376
End bp	353584
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	42%
IMG OID	640105697
Product	isocitrate dehydrogenase
Protein accession	YP_001036717
Protein GI	125972807
COG category	[C] Energy production and conversion
COG ID	[COG0538] Isocitrate dehydrogenases
TIGRFAM ID	[TIGR00127] isocitrate dehydrogenase, NADP-dependent, eukaryotic type

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.432651
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAAGA TAAAAATGAA AGTTCCGTTG GTCGAGATGG ACGGAGATGA AATGACCCGA 
ATCATATGGA GATTGATAAA GGAAAATCTC TTGGAGCCAT ACATAGAGCT CAATACAGAA 
TATTACGATT TGGGGCTTGA AAACAGGGAC AAGACCGAGG ACCAGGTTAC CATTGACGCT 
GCCAGGGCTA TTCAGAAATA TGGTGTTGGA GTAAAGTGCG CGACTATTAC TCCCAATGCT 
CAGAGGGTTG AGGAATACAA CTTAAAGAAG ATGTGGAAGA GTCCTAACGG TACAATCAGG 
GCGATTCTTG ATGGTACGGT TTTCCGTGCC CCGATAGTTG TAAACAGCAT AAAGCCCTTT 
GTTAAAGGAT GGAAAAAACC TATTTCCATT GCAAGGCATG CTTACGGTGA CGTATACAAG 
AATGTGGAAT ACTATGTGCC TTCGGCGGGA AAAGCCGAGC TTGTATTTAC GTCTGAAAAC 
GGAGAGGTTT CAAGGCAGAC CATTCATGAG TTTGACGGTC CCGGTGTGAT AATGGGTATG 
CACAATACCG ACAAATCCAT CAGAAGCTTT GCAAGGGCCT GCTTTAACTA TGCCCTTGAC 
ATGAACCAGG ACCTCTGGTT TTCAACCAAG GATACCATTT CGAAGACATA TGACCATAGG 
TTTAAAGATA TATTCCAGGA AATCTATGAA AACGAGTACA AGGAAAAATT CGAAGCCAAG 
AATTTGCAAT ATTTCTACAC TCTGATAGAC GATGCTGTGG CACGTATTAT AAGATCTGAA 
GGCGGCATGG TTTGGGCATG CAAGAATTAT GACGGTGATG TCATGTCCGA TATGGTGGCT 
TCTGCCTTTG GAAGTCTTGC AATGATGACG TCAGTTCTGG TTTCACCCGA CGGAAAGTAT 
GAGTTTGAAG CAGCACATGG AACTGTTACA AGACATTATT ACAAGCACCT TAAAGGAGAA 
GAGACATCCA CCAACTCAAT GGCAACCATA TTTGCATGGA CGGGTGCATT AAAGAAACGC 
GGCGAGCTGG ATGGCATAAA AGAGCTTGTT GATTTTGCAA CCAAGCTTGA ACAAGCATCT 
GTTCAGACAA TAGAAAATGG TGTAATGACA AAGGATCTTG CTTCGCTTTC AGAAGTTCCG 
GAGAAGAAAA TAGTAAATAC TGAGGATTTT CTTAAAGAAA TCAGGAAAAC TTTTGAAGGT 
ATGGCATAA

Protein sequence

MSKIKMKVPL VEMDGDEMTR IIWRLIKENL LEPYIELNTE YYDLGLENRD KTEDQVTIDA 
ARAIQKYGVG VKCATITPNA QRVEEYNLKK MWKSPNGTIR AILDGTVFRA PIVVNSIKPF 
VKGWKKPISI ARHAYGDVYK NVEYYVPSAG KAELVFTSEN GEVSRQTIHE FDGPGVIMGM 
HNTDKSIRSF ARACFNYALD MNQDLWFSTK DTISKTYDHR FKDIFQEIYE NEYKEKFEAK 
NLQYFYTLID DAVARIIRSE GGMVWACKNY DGDVMSDMVA SAFGSLAMMT SVLVSPDGKY 
EFEAAHGTVT RHYYKHLKGE ETSTNSMATI FAWTGALKKR GELDGIKELV DFATKLEQAS 
VQTIENGVMT KDLASLSEVP EKKIVNTEDF LKEIRKTFEG MA