Gene Cthe_0173 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0173
Symbol
ID	4808661
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	208546
End bp	209640
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	38%
IMG OID	640105584
Product	dehydrogenase (flavoproteins)
Protein accession	YP_001036607
Protein GI	125972697
COG category	[C] Energy production and conversion
COG ID	[COG0644] Dehydrogenases (flavoproteins)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGATTG CCATAATTGG TGCAGGACTG GCCGGGCTGT CCTGTGCTTT TGAATTGGAG 
AGAAACGGCA TAACGCCGGT TATTTTTGAG AAAAGATCTT TTATAGGAGA AAACTACATG 
TTTCCCAGTA CAACTCTAAG ACTGTTTGAC AGGGGTTTTA ATAATCCCGT AAAATATCTC 
AAAAAAAAAT ACGACCTGAG TCTTATACCT TTTTCCCCTT TAAGAGAAAT AACAATGAAG 
GGACCCACAA AAGAAGGAAC CGTAAGCGGA AAATTGGGAT ATGTATTCAT GAGAGGAGAC 
GAAAAAGAAT CCCTGGAAAA TCAGATTGCA AAGCATATCA GGACTCCCAT GCATTTTGAC 
ACATATATAA ATCTTGAGGA TGTAAAAAAT GATTTTGATT ATATTATTGT CGCGACCGGC 
GATGAAACCG TTGCGAACCG GCTTGGAGTA TGGCACACAA CGACAACTGT TTATACAAGG 
GTTGCTCTTG TATTGGGAAA TTTCAAAGTG GGTTGTGCAA AAATGTGGGT CAACCGGGAT 
TATGACAAAG CGTGCTACGC ATTTTTGTCT CCCCATAGTA AAAAAAGTGC GAGACTGCTT 
TTATCTGTCA ATGATATATC ACCCCATGAA TTTGACTATT ACTGGAATAA TTTTGTAAGG 
CTTGAGGAAG TGAAATATAA AATAAATGAA ACCAGGGACA TTGTAACAAG ACTTGGATAC 
GTATCCACTG CAAAAGTGGG AAATGTTTAT TTGACCGGAA ATGCCGCAGG GCTTATTGAT 
GATTTTTTGG GTTTTGGCGC CATTAACGCC ATTGAAAGCG GAATTCTTGC GGCAAAGGCA 
ATCATAAAAG GAAAAGACTA CAATGAAATG GTAAAATCTA TAAAAAATCA TGTAGCCGGC 
ATTCATGAAC TTAGAAAAAT GATAAACGAA TTTGACAATG ATGATTATGA GCGGCTTATA 
AAAATTTTGA CCATGCCTGT TATAAAACGG ATTATTTACA ACAATCCTCT GGCAAAGGTC 
CAAAGTATTA CGTCTGCGGC AAAAGAGTTC AACAACATGA AGCATAAAAG GCAGCGGCGT 
TTTTCCAAAA GCTAG

Protein sequence

MKIAIIGAGL AGLSCAFELE RNGITPVIFE KRSFIGENYM FPSTTLRLFD RGFNNPVKYL 
KKKYDLSLIP FSPLREITMK GPTKEGTVSG KLGYVFMRGD EKESLENQIA KHIRTPMHFD 
TYINLEDVKN DFDYIIVATG DETVANRLGV WHTTTTVYTR VALVLGNFKV GCAKMWVNRD 
YDKACYAFLS PHSKKSARLL LSVNDISPHE FDYYWNNFVR LEEVKYKINE TRDIVTRLGY 
VSTAKVGNVY LTGNAAGLID DFLGFGAINA IESGILAAKA IIKGKDYNEM VKSIKNHVAG 
IHELRKMINE FDNDDYERLI KILTMPVIKR IIYNNPLAKV QSITSAAKEF NNMKHKRQRR 
FSKS