Gene Cthe_2991 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2991
Symbol
ID	4811139
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	3510336
End bp	3512273
Gene Length	1938 bp
Protein Length	645 aa
Translation table	11
GC content	45%
IMG OID	640108412
Product	NADH:flavin oxidoreductase/NADH oxidase
Protein accession	YP_001039380
Protein GI	125975470
COG category	[C] Energy production and conversion [O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0492] Thioredoxin reductase [COG1902] NADH:flavin oxidoreductases, Old Yellow Enzyme family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGTATG ACAAACTTTT TGAGCCGGGA TATATCGGAA AAGTAAAGAT TAAAAACAGA 
CTGGTAATGT CTCCGATGAA TACCCATTTT TCCATAGGAG ACCCTGCAGT ACTTTCCGAA 
AGGTATTTTG AATATTACAA AGCACGGGCA AGAGGAGGAG TGGGACTTAT AATTACAACC 
CATGTAAAGG CGGAAAAAAA CATTGACCCG TATCCTCTTA CCTATGGCTA TGCCACTTTT 
GATTCTGTAA GCCAGATAAA GTATTTCAAT GAAATAACCG AAATGGCTCA CAGATATGAT 
GCAAAGATTG CAATTGAACT GTCTCCGGGT ACCGGAAGAC TGGCCGATGC AACGTTAAAG 
GACAAATGGC CTGTCGGGCC TTCGGAAATT GAGATACTGG GTATGCCGGG AGTTAAAACA 
CGGGCGCTTA CCAAGGATGA GATACACGGA CTTGTGGAGG CTTATGGGAA AGCGGCGGGA 
TTGGCAAAGC AGGCGGGTTT TGACATAATT TATGTTCACT TTACCGCTTA TCTCGGAGAC 
CAATTCCTTT CTTCGGCCTG GAATCACAGA ACGGATGAAT ATGGTGGAAG TCTTGAAAAC 
CGAATGCGGT TTTTGCTCGA ATGCATTGAG AGTGCACGAA ACAATGTGGG AAGCGATTTT 
CCCATGATTG TGGGATTGGC GTTGGATCAT GGATTCCCCG GAGGAAGGGA GCTTGACGAA 
ACAATAGAAA TTGCAAAAAG GCTCAAACAG ATAGGCATAG ATACATTGCA TCTCAGACGT 
GGAAGCTATG ACAACATGAA TCTTCTTATA CCTACCGAAT ATATGGAGGA CGCCGTTTCT 
GTCGACTATG CGGCCAAAGT CAGAGAACAG GCAGGTATAC AGGTGATTTC CGATGGAAAC 
ATTTCAGATC CGGTCCTTGC GAATAAACTG ATGGAAGAAA ACAAGCTTGA CTTTGTAGGC 
CTTGGAAGAG CTCTTTTGGC CGACCCGGAG TGGGTGAACA AGGTACGGGC TGACAAGAAA 
GAGGATATAG TACCTTGTGT GCGGTGCATG CAGTGCATTA ACAGAATATT TTTTGGGCAA 
TATGCCGCAT GCAGCGTAAA TCCTGTTCTT GGAAAAGAGT ACTTAAGCCC GATACTGCCT 
GCAAAGAAGC CTAAGAAAGT GCTTGTAATA GGCGGAGGGA TGGCAGGTAT GGCATTTGCA 
AAGATGGCAG AAGAAAAAGG GCATGACGTT ACATTGCTTG AGAGCACTTC AGAGCTTGGA 
GGACACTTGC TTGAAGGTGC GGTGATGGAT CACAAGAAGG AAGTTGACGC ATACTGCAGG 
CATTTGGTAA GGGAGATTAA AAACTCCGGT GTGAAAGTAA AGTACAACAC CAGGGCTACA 
AAAGAATTGG TGAAGGAGCT CAATCCGGAT GCGGTTGTGG TGGCAACAGG TTCCGTGCCT 
GTAATTCCTG ATGTTCCGGG CATTGACAGA CCCAATGTGA GGATAGCCAC CAAGCTTCTT 
AAAGAAGGGC AGGACACCGG GCAGAATGTG ATTATCGTCG GCGGAGGTTT GGTGGGCTGC 
GAAACGGGAT TGCACCTTGC AGAAAAGGGA AAGAAAGTAA CCATAATAGA TATGCTTCCG 
GAAGTGGCTC AGGATGTTAT TTTCATGGCG AGATTTTCCC TGCTTGAGGC ACTTAAGAAT 
AAAGGGATAG AAACCTATGG AGGGCTTAAA CTGACAGAAA TAACAGAGTC GGGTATCGTT 
GTTGAGGATT CCAATGGAGA TAAAAAGGAG ATGGCTTGCG ACACTGTGGT AATTGCTGTG 
GGATTAAAGG CGGATGACAC TTTGTACAAT GAGCTTGTAA ATGAGTTTGA TGAAGTGTAT 
CGAATTGGCG ACTGCATCAA GGCAAGAAAG TTTATTGATG CAATCCAGGA AGCCTTCCAG 
GTGGCGGTGG ATATATAA

Protein sequence

MAYDKLFEPG YIGKVKIKNR LVMSPMNTHF SIGDPAVLSE RYFEYYKARA RGGVGLIITT 
HVKAEKNIDP YPLTYGYATF DSVSQIKYFN EITEMAHRYD AKIAIELSPG TGRLADATLK 
DKWPVGPSEI EILGMPGVKT RALTKDEIHG LVEAYGKAAG LAKQAGFDII YVHFTAYLGD 
QFLSSAWNHR TDEYGGSLEN RMRFLLECIE SARNNVGSDF PMIVGLALDH GFPGGRELDE 
TIEIAKRLKQ IGIDTLHLRR GSYDNMNLLI PTEYMEDAVS VDYAAKVREQ AGIQVISDGN 
ISDPVLANKL MEENKLDFVG LGRALLADPE WVNKVRADKK EDIVPCVRCM QCINRIFFGQ 
YAACSVNPVL GKEYLSPILP AKKPKKVLVI GGGMAGMAFA KMAEEKGHDV TLLESTSELG 
GHLLEGAVMD HKKEVDAYCR HLVREIKNSG VKVKYNTRAT KELVKELNPD AVVVATGSVP 
VIPDVPGIDR PNVRIATKLL KEGQDTGQNV IIVGGGLVGC ETGLHLAEKG KKVTIIDMLP 
EVAQDVIFMA RFSLLEALKN KGIETYGGLK LTEITESGIV VEDSNGDKKE MACDTVVIAV 
GLKADDTLYN ELVNEFDEVY RIGDCIKARK FIDAIQEAFQ VAVDI