Gene Cthe_0701 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0701
Symbol
ID	4810319
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	859667
End bp	861064
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	43%
IMG OID	640106118
Product	oxaloacetate decarboxylase
Protein accession	YP_001037129
Protein GI	125973219
COG category	[C] Energy production and conversion
COG ID	[COG5016] Pyruvate/oxaloacetate carboxyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTAAGG TAAAAATTAC CGAAACGGCG CTGAGGGATG CCCATCAATC TCTCATTGCA 
ACAAGAATGA GAATAGAAGA GATGCTTCCT ATCATAGATA AACTGGACGA GATCGGTTAT 
CATTCTTTGG AGGTATGGGG CGGTGCAACC TTTGATGCCT GCCTGAGATT TTTGAATGAA 
GACCCGTGGG AAAGGCTTAG AATTATAAAA AGCCACTGCA AGAAAACTCC CCTTCAAATG 
CTTTTAAGAG GCCAGAATCT TTTGGGTTAC AAGCATTATG CCGATGACGT TGTGGAGTAC 
TTTGTACAAA AGAGCGTTGC AAACGGTATA AACATAATAA GAATTTTCGA CGCCTTGAAT 
GACACCAGAA ATATAGAAAC TGCAATCAAA GCCTGCAAAA AAGAAGGCGG TCATGCTCAG 
GGAACGGTAT GTTATACAAT AAGTCCCGTT CACAATCTTG AACTTTTTGT CAAAGATGCA 
AAGACTCTTG TGGAAATGGG AGCTGACTCC ATATGCGTAA AGGATATGGC AGGACTTCTG 
CTTCCATATG TTGCATATGA CCTTATCAAA GCATTAAAAG AAAACGTAAA AGTGCCGATT 
CAACTTCATA CCCACTATAC GAGCGGTGTT GCTTCAATGA CATATCTGAA GGCAATTGAG 
GCAGGGTGCG ATGTTGTGGA CTGCGCTATC TCACCAATGT CAATGGGAAC ATCCCAGCCT 
CCGACAGAAC CTCTTGTGGC AACCTTAAAA GGCACGCCGT ACGATACCGG ACTTGACCTG 
GATAAATTAA GTGAAATCGC AGACTACTTC AGACCTCTCA AAGAAAAGTA TATTTCAGAA 
GGACTTCTTG ATGTAAAGGT TATGGGAGTT GACGTAAACA CTCTCAAATA CCAGGTACCC 
GGTGGAATGC TTTCAAACCT GGTGTCTCAG TTAAAGCAGT CCAATGCGGT TGATAAATTC 
GAAGAGGTTC TGAAAGAAGT GCCAAGAGTA AGAGAAGACT TCGGATATCC TCCGTTGGTT 
ACACCTACAA GCCAGATTGT AGGTACTCAG GCAGTTTTAA ATGTGGTAAC GGGTGAAAGA 
TACAAAATGG TTCCAAAAGA ATCCAAGGCA CTGATCAAGG GTGAATACGG CAGAACACCG 
GCTCCGGTCA ACCCTGAAGT TCAGAAGAAG ATTTTAAAAG ATGAAGAGCC GATTACAGTT 
AGACCTGCTG ATTTGATAGA GCCCGAGCTT GACAAGATCA GAAATGAAAT GAAAGAATAC 
CTGGAACAAG ACGAGGACGT TTTGTCCTAT GCACTGTTCC CGCAGGTGGC AGAGAAGTTC 
TTCCAATACA GGAAAGCTCA AAAATATAAG ATAGAACCGG ACATGGTCGA TTACGAAAAC 
AGGGTTCATC CGGTTTAA

Protein sequence

MAKVKITETA LRDAHQSLIA TRMRIEEMLP IIDKLDEIGY HSLEVWGGAT FDACLRFLNE 
DPWERLRIIK SHCKKTPLQM LLRGQNLLGY KHYADDVVEY FVQKSVANGI NIIRIFDALN 
DTRNIETAIK ACKKEGGHAQ GTVCYTISPV HNLELFVKDA KTLVEMGADS ICVKDMAGLL 
LPYVAYDLIK ALKENVKVPI QLHTHYTSGV ASMTYLKAIE AGCDVVDCAI SPMSMGTSQP 
PTEPLVATLK GTPYDTGLDL DKLSEIADYF RPLKEKYISE GLLDVKVMGV DVNTLKYQVP 
GGMLSNLVSQ LKQSNAVDKF EEVLKEVPRV REDFGYPPLV TPTSQIVGTQ AVLNVVTGER 
YKMVPKESKA LIKGEYGRTP APVNPEVQKK ILKDEEPITV RPADLIEPEL DKIRNEMKEY 
LEQDEDVLSY ALFPQVAEKF FQYRKAQKYK IEPDMVDYEN RVHPV