Gene Cthe_1492 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1492
Symbol
ID	4810642
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1812018
End bp	1813640
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	41%
IMG OID	640106912
Product	NAD(P)H dehydrogenase (quinone)
Protein accession	YP_001037913
Protein GI	125974003
COG category	[R] General function prediction only
COG ID	[COG0655] Multimeric flavodoxin WrbA
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATAC TTGTTATAAA CGGAAGTCCG AAAGGTGATG CCAGCAACTC TTTGAAACTT 
ACCAAAGCCT TTCTCGAAGG TATGGGAGAC AATGATGTAA GGGAAGTTAC GGTGTCCAGG 
CTGAATTTAT CGCCCTGCAA GGGCTGTTTT TGCTGCTGGA GCAAAACGCC CGGAAAATGC 
GTGATAAATG ATGATATGAG CCGGGTTATA GAGGATGAAT TGTGGGCTGA CATTATCATT 
TGGAGTTTTC CTTTGTACTA TTTTAATGTT CCGGGCCCGC TTAAAAACTT GATTGACAGA 
CAGCTTCCAA TGAACCTTCC CTTTATGACG GAGCGAGAAG ACGGTATGGG AAGCGGAAGT 
CACCCTTCAA GATATGATAT GAGCGGCAAA AGATACATTT TAATTTCCAC CTGTGGGTTT 
TATTCCGCCG AAAAAAATTA TGAAAGTGTA AAAAGTATGT TTGACTATAT TTGTGGCAAA 
GGCAATTATG AGACAATTTT CTGCGGTCAG GGAGAACTGT TTCGTGCTCC GGAATTGAAA 
AAAAGAACGG ACGAATACCT CGATATAGTA AGAAAAGCCG GCAGAGAATA TATATCAACA 
GGTATTTCAA ATGAGACAAG AAGCAAGCTG AATGAACTTT TGTATCCTAA GGAAGTATTT 
GAACAAATGG CTGATGCCAG TTGGGGAATT GACAAAGAAA CCGGCAATGA AGTTGACAAG 
AGTCTTTCTT TCACCAGGCA AATGGCGGCT TTGTACAATA AGGGAAGTTA TGACGGAAAA 
GACCGTGTGC TGGAGATATG TTACACGGAT TTGGGCAAAA CCTATCAAAT TTTATTGGGG 
AAAGACGGCA GCAAAGTTTT TACCGCCGGC AGTTTGCCGG CAACAACAAG AATTGAGACA 
CCGTGGGAAG TATGGACATC CATTGCCAGA GGTGAGATAA GAGGAGATGT GGCACTTTTT 
AAAGGTATGT ATAAGGTTAC CGGTGATTTT TCTTTGATGA TGAATTGGGA TAAATATTTT 
AGCAAAACCA AAGAACAACA GGAAAATGAG ATTGACAAAA GCCTGACATC AAAGAATAAA 
AAGCCGTCAA TGATGACAAT GCTGATTCCG TGGATTACGT TTTGGATTGC CGTATCCATT 
AACGCCAATA TAGGTGCAAT TATTACCCTT GCAGTTTGTG CATGCACTCC CATGGTTATG 
GCACGAAAAG AGCTGACCGT TTATGACAAA ATTTCAATGG CGGTTGTATC ACTTTTATCG 
GTTCTGACTT TACAGAATGA CATGAAAATA ATATCCATTG TGGCAGGATA CCTTGCATTC 
GGGCTTATGT GGCTTCTGTC CTGCTTTACA CGAGAGCCTC TTTGCGCCGC GTATGTCAAG 
TACGATTATA ACGGTGAAGA TGCGTTAAAC AACCCTATTT TCATGAAAAC AAATTATGTA 
TTGGCCGTAG GCTGGGGAAT TTTATATATT TTAACAGCGA TTTGGTCGTG GTTTTTGATG 
CGTTTGAACA TGATCGTGCT GTTGCAAATT CTGAATAATG CTGCGACCTG GGCTATGGGT 
ATTTTTACGA TATGGTTTGT AAGATGGTAT CCGCAGCATA TTGCGTTAAA AGGCAAGCGT 
TAA

Protein sequence

MKILVINGSP KGDASNSLKL TKAFLEGMGD NDVREVTVSR LNLSPCKGCF CCWSKTPGKC 
VINDDMSRVI EDELWADIII WSFPLYYFNV PGPLKNLIDR QLPMNLPFMT EREDGMGSGS 
HPSRYDMSGK RYILISTCGF YSAEKNYESV KSMFDYICGK GNYETIFCGQ GELFRAPELK 
KRTDEYLDIV RKAGREYIST GISNETRSKL NELLYPKEVF EQMADASWGI DKETGNEVDK 
SLSFTRQMAA LYNKGSYDGK DRVLEICYTD LGKTYQILLG KDGSKVFTAG SLPATTRIET 
PWEVWTSIAR GEIRGDVALF KGMYKVTGDF SLMMNWDKYF SKTKEQQENE IDKSLTSKNK 
KPSMMTMLIP WITFWIAVSI NANIGAIITL AVCACTPMVM ARKELTVYDK ISMAVVSLLS 
VLTLQNDMKI ISIVAGYLAF GLMWLLSCFT REPLCAAYVK YDYNGEDALN NPIFMKTNYV 
LAVGWGILYI LTAIWSWFLM RLNMIVLLQI LNNAATWAMG IFTIWFVRWY PQHIALKGKR