Gene Cthe_2801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2801
Symbol
ID	4810118
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	3301150
End bp	3303162
Gene Length	2013 bp
Protein Length	670 aa
Translation table	11
GC content	47%
IMG OID	640108221
Product	carbon-monoxide dehydrogenase, catalytic subunit
Protein accession	YP_001039193
Protein GI	125975283
COG category	[C] Energy production and conversion
COG ID	[COG1151] 6Fe-6S prismane cluster-containing protein
TIGRFAM ID	[TIGR01702] carbon-monoxide dehydrogenase, catalytic subunit

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000137875
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTTTT ATAAAGATAA GGAAATAAGA TACCACCACA GGCATTTTCA TAACGAAGGT 
GGGCACCACC ATCATCAGGA TTCCTTTGAT GATTACAACA ATGCGGTTAA TGAATACAAG 
AAAAGCTTTC CGTCAAAAGC AAATGTTATA GAGAACACTC CGGACCCTGC GGTAAGAAAA 
ATGCTTGTAC ATATGGAAAA GCAGGGCTGT GAGACATGTT TTGACCGCTT TGACAGTCAG 
AAACCCCACT GTAATTTCGG GCTTGCGGGT GTCTGCTGCA AAAACTGCAA CATGGGGCCG 
TGCAGAATAA CGAAGAAAAG CCCCAGAGGA GTGTGCGGAG CGGATGCCGA CCTCATTGTT 
GCAAGAAATC TTCTAAGGTG GGTGGCGGCA GGTGTTGCAG CCCATGGAGC AAGGGGCCGC 
GAAATAATGC TGGCACTGAA AGCGGCCGGG GAAGGAATAC TTGACATGCC TGTTGCAGGA 
GAAGCAAAGC TTAGAAAATC CGCCGCCCAA CTTGGCATAT CCACCGAGGG CAAGACCAGG 
GAAGAGTTGG CGGTGGAAGT TGCAGACATT CTTCTTGAGG ATTTGTCAAG GACGGTTCCG 
GGAGAGCACA AGACATTAAA TGCTTTTGCA ACCAAAGAAA GAATTGAAAA GTGGCGCGAG 
CTAGACATTC TTCCCATAGG GGCCTATCAT GAAGTGTTTG AAGCCCTCCA TCGGACCAGT 
ACGGGAACGG ACGGAGATTG GAAAAACATT ATGAAGCAAT TTTTAAGATG CGGGCTGGCT 
TTTGCCTGGA GCAGCGTTTT AGGCTCTTCA ATAGCCATGG ACAGTTTGTT TGGTTTGCCC 
GTAAGAAGCA CCGTTAAAGC AAATTTGGGT GCCCTTAGGG AAGGTTATGT TAATATTGCC 
GTTCACGGTC ATTCCCCTCT TTTGGTCAGT GAAATAGTAA AGCAGGGAAG AAGCCGGGAA 
TTTATACAAA TGGCAAAAGA AAAAGGAGCC TTGGGAATAC AGTTCTATGG AATATGCTGC 
TCGGGACTTT CGGCAATGTA CCGTTATGGG GGAGTTATTC CTCTTTCCAA CGCAATTGGT 
GCGGAGCTGG TTCTTGGCAC CGGGGCCATT GATTTGTGGG TGGCGGATGT CCAGGATGTA 
TTCCCGTCAA TAATGGATGT TGCTAAATGC TTTAAAACCA CGGTTGTTAC AACCAGCGAC 
TCTGCAAGAC TTCCCGGAGC GGAGCATTAC GCCTATGACC ATCACCATTC AAACCTGGCC 
CAGACGCAGG AATTGGCAAA AACCATAGTT AAGAGGGCTA TTGAAAGCTT TGAGGCAAGA 
AGGGACGTTC CGGTCTTTAT TCCAAATTAT GAGGTGGATG CGGAGATCGG TTTTTCCGTA 
GAGTATGCCA CAAGCCGTTT TGGAAGCATG GATGTGATTG CGAAGGCTCT GCAGGAAGGC 
AAAATCCGCG GTGTTGTAAA CCTTGTGGGC TGCAACAATC CGAGAGTTAT GTATGAAAAA 
GCAATAGCAG ATGTGGCAAG AAAGCTTATT GAAAACAACA TTCTTGTGCT TACCAACGGT 
TGTGCGTCCT TTCCCCTTTT GAAGCTTGGC TATTGCAATG TTAAAGCATT GGAATGGACA 
GGTAAGGAGC TTAGGGAATT TTTGGAGCCG GATTTGCCTC CGGTGTGGCA TATGGGCGAA 
TGTCTTGACA ATGCAAGGGC ATCAGCCTTT TTCAGAGCAT TGGCGGACAG CCTGAAGAAA 
GATATAAAAG ACATGCCTTT TGCGTTTGCA AGTCCCGAAT GGTCCAATGA AAAGGGTGTC 
GGGGCGGCCC TTGGATTCAG GCTTTTAGGT ATAAACTCCT ATCATTCGGT TTATCCGCCT 
GTTCAAGGTT CTAAAAATGT AATGAAATAT CTGTTTGAAG ATACGGAAAA AACCCTGGGA 
GCTGTCATGA TAGTGGAAGT GGATCCGCTG AAGCTCGCAG ACAGAATAAT TTCAGACATC 
GATGAAAAGA GAAAGGCTTT GATGTGGAAA TGA

Protein sequence

MNFYKDKEIR YHHRHFHNEG GHHHHQDSFD DYNNAVNEYK KSFPSKANVI ENTPDPAVRK 
MLVHMEKQGC ETCFDRFDSQ KPHCNFGLAG VCCKNCNMGP CRITKKSPRG VCGADADLIV 
ARNLLRWVAA GVAAHGARGR EIMLALKAAG EGILDMPVAG EAKLRKSAAQ LGISTEGKTR 
EELAVEVADI LLEDLSRTVP GEHKTLNAFA TKERIEKWRE LDILPIGAYH EVFEALHRTS 
TGTDGDWKNI MKQFLRCGLA FAWSSVLGSS IAMDSLFGLP VRSTVKANLG ALREGYVNIA 
VHGHSPLLVS EIVKQGRSRE FIQMAKEKGA LGIQFYGICC SGLSAMYRYG GVIPLSNAIG 
AELVLGTGAI DLWVADVQDV FPSIMDVAKC FKTTVVTTSD SARLPGAEHY AYDHHHSNLA 
QTQELAKTIV KRAIESFEAR RDVPVFIPNY EVDAEIGFSV EYATSRFGSM DVIAKALQEG 
KIRGVVNLVG CNNPRVMYEK AIADVARKLI ENNILVLTNG CASFPLLKLG YCNVKALEWT 
GKELREFLEP DLPPVWHMGE CLDNARASAF FRALADSLKK DIKDMPFAFA SPEWSNEKGV 
GAALGFRLLG INSYHSVYPP VQGSKNVMKY LFEDTEKTLG AVMIVEVDPL KLADRIISDI 
DEKRKALMWK