Gene Cthe_2392 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2392
Symbol
ID	4811044
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	2857007
End bp	2858191
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	43%
IMG OID	640107805
Product	pyruvate ferredoxin oxidoreductase, alpha subunit
Protein accession	YP_001038787
Protein GI	125974877
COG category	[C] Energy production and conversion
COG ID	[COG0674] Pyruvate:ferredoxin oxidoreductase and related 2-oxoacid:ferredoxin oxidoreductases, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00104285
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAATAA GAGAAAGGCT TAGCGGTAAT GAGGCAACGG CGATTGCCAT GAGACAAATA 
AATCCTGATG TGGTTGCTGC TTTTCCGATA ACACCGTCAA CGGAAATTCC TCAATATTTC 
TCGTCATATG TCGCTGACGG ACTTGTAGAT ACGGAATTTG TTGCTGTGGA ATCAGAGCAC 
AGTGCAATGT CTGCATGTAT AGGTGCTCAG GCTGCAGGTG CAAGAGCAAT GACTGCCACA 
TCCGCAAACG GTTTGGCATA TATGTGGGAG GCTTTGTATA TAGCGGCAAG TATGAGACTT 
CCGATTGTAT TGGCGGCTGT AAACAGAGCA CTTTCAGGTC CTATCAATAT CCACAACGAC 
CACAGCGATA CAATGGGAGC TAGGGATTCG GGATGGATCC AGTTATACAG TGAAAACAAC 
CAGGAGGCTT ATGACAACAT GCTTATGGCT CACAGGATAG GTGAGCATCC TGATGTAATG 
CTTCCTGTCA TGGTCTGCCA GGACGGATTT ATTACTTCTC ACGCAATAGA AAATATTGAA 
CTGGTGGAAG ATGAGAAAGT TAAGGCTTTT GTAGGAGAAT ACAAACCGAC TCATTATCTT 
CTCGACAGGG AAAATCCGAT TTCTGTGGGT CCTTTGGATT TGCAGATGCA TTATTTCGAG 
CACAAGAGAC AGCAGGCACA GGCAATGGAA AACGCCAAAA AGGTAATTCT TGAAGTGGCG 
GAAGAATTCT ACAAGCTTAC GGGAAGAAAA TACGGATTTT TTGAAGAATA CAAAACCGAT 
GATGCCGATG TTGCCATTGT TGTTATGAAC TCCACTGCCG GTACTGTAAA ATATGTTATC 
GACGAGTACA GGGCAAAAGG CAAAAAAGTT GGTTTGATAA AACCTAGAGT ATTCAGACCT 
TTCCCTGTTG ATGAACTGGC ACAGGCTTTG TCAAAGTTTA AGGCAGTGGC CGTTATGGAC 
AAGGCTGACA GCTTCAATGC AGCCGGAGGA CCTTTGTTTA CAGAGGTAAC AAGTGCACTC 
TTCACAAAAG GAGTATTTGG TCCTAAGGTT ATTAACTATA AGTTTGGATT GGGTGGAAGA 
GACGTTAAAG TTGATGATAT TGAAGTTGTT TGTGAGAAGC TTCTGGAAAT TGCAAGTACA 
GGCAAGGTAG ACTCAGTATA CAATTACCTT GGTGTTAGAG AGTAG

Protein sequence

MGIRERLSGN EATAIAMRQI NPDVVAAFPI TPSTEIPQYF SSYVADGLVD TEFVAVESEH 
SAMSACIGAQ AAGARAMTAT SANGLAYMWE ALYIAASMRL PIVLAAVNRA LSGPINIHND 
HSDTMGARDS GWIQLYSENN QEAYDNMLMA HRIGEHPDVM LPVMVCQDGF ITSHAIENIE 
LVEDEKVKAF VGEYKPTHYL LDRENPISVG PLDLQMHYFE HKRQQAQAME NAKKVILEVA 
EEFYKLTGRK YGFFEEYKTD DADVAIVVMN STAGTVKYVI DEYRAKGKKV GLIKPRVFRP 
FPVDELAQAL SKFKAVAVMD KADSFNAAGG PLFTEVTSAL FTKGVFGPKV INYKFGLGGR 
DVKVDDIEVV CEKLLEIAST GKVDSVYNYL GVRE