Gene Cthe_0866 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0866
Symbol
ID	4810484
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1041517
End bp	1042557
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	44%
IMG OID	640106282
Product	pyruvate flavodoxin/ferredoxin oxidoreductase-like protein
Protein accession	YP_001037293
Protein GI	125973383
COG category	[C] Energy production and conversion
COG ID	[COG0674] Pyruvate:ferredoxin oxidoreductase and related 2-oxoacid:ferredoxin oxidoreductases, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000000123554
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGGAA ACGAAGCTAT TGCAGAAGCT GCTTTAAGAG CAGGATGCAG GCACTATTTC 
GGATACCCGA TTACACCACA AACAGAAATT GCACATTATT TGGCAAAGAA AATGCCGGAG 
GTTGGCGGAA CTTTTATCCA GGCAGAGAGT GAGGTTGCCG CCATAAACAT GGTTTACGGT 
GCTGCCAGTG CGGGAGCAAG GGTCTTAACT TCGTCATCCA GTCCGGGTAT AAGTCTGAAA 
CAGGAAGGAC TGTCTTATCT TGCCGGTGCG GAGCTTCCGG CTGTTGTTGT CAATATCGTA 
AGATGTGGAC CGGGTCTTGG AGGAATACTG CCTGCACAGG GAGATTATTT CCAGGCTGTG 
AAAGGTGGAG GTCACGGAGA TTACAAGATG GTTGTACTGG CACCTTCCAG CGTTCAGGAA 
CTTTATGAGC TTACTGTGGA GGCTTTTAAT ATTGCCGACA GATACAGAAT TGTATCAATG 
ATTATGGGTG ACGGAATTTT AGGACAGATG ATGGAAGCCG TTGAGTTTAA AGATGTTGAG 
AATATAGAAA AAATTGACAA GCCCTGGGCT ACAACAGGTA CACAGATGAA GAGAGAGCAT 
AATACCATAA CCTCCATCTA TATTCAACCC GAAGTTCTGG AGAAGCACAA TCAAAAGCTG 
CAGGCAAAAT ACAGATTGAT TGAGGAAAGG GAAACCCGTG TTGAAAGTTA CAATTGTGAA 
AATGCGGATA TTATAGTGAC CGCTTTTGGT ACGGTTGCAA GAATAGTGAA AAATGTTATC 
AAGATGGCCG AGAAGGAAGG AATAAAAGTT GGTTTGATCA GACCTATAAC TTTGTGGCCT 
TTCCCGACAA AAGAGTATGA AAAATATGCG GATGTGCCGA AAGCATTTTT GACTGTGGAA 
CTTAATGCCG GCCAAATGGT TGAGGATGTA AGGCTCGCGG TCAACGGCAA AAAACCTGTG 
TATTTCCATG GAAGAATGGG CGGAATGATA CCGACACAAA AGGAAATATT GGACAAGATA 
AAGGAAATTT TGAACAATTA A

Protein sequence

MKGNEAIAEA ALRAGCRHYF GYPITPQTEI AHYLAKKMPE VGGTFIQAES EVAAINMVYG 
AASAGARVLT SSSSPGISLK QEGLSYLAGA ELPAVVVNIV RCGPGLGGIL PAQGDYFQAV 
KGGGHGDYKM VVLAPSSVQE LYELTVEAFN IADRYRIVSM IMGDGILGQM MEAVEFKDVE 
NIEKIDKPWA TTGTQMKREH NTITSIYIQP EVLEKHNQKL QAKYRLIEER ETRVESYNCE 
NADIIVTAFG TVARIVKNVI KMAEKEGIKV GLIRPITLWP FPTKEYEKYA DVPKAFLTVE 
LNAGQMVEDV RLAVNGKKPV YFHGRMGGMI PTQKEILDKI KEILNN