Gene Cthe_0156 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0156
Symbol
ID	4808644
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	195093
End bp	196934
Gene Length	1842 bp
Protein Length	613 aa
Translation table	11
GC content	43%
IMG OID	640105567
Product	radical SAM family protein
Protein accession	YP_001036590
Protein GI	125972680
COG category	[C] Energy production and conversion
COG ID	[COG1032] Fe-S oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGGTATTA GAGTAAGTGA CAGAATATTA CAGAGTGTGG AAAAACCATC AAGATATACG 
GGCAATGAAT GGAACAGCGT AAAAAAAGAT TTAAAGGGAA TAGATATAAG ATTTGCTTTC 
TGTTTCCCTG ATGTTTATGA AGTTGGGATG TCTCATCTTG GCATGAAGAT TTTGTATCAC 
CTTCTCAACG AGAGGGAGGA TACTTACTGT GAAAGAGTTT TTGCTCCATG GGTTGACATG 
GAAGCAAAGA TGAGAGAGCA CAACATACCT CTTTTTGCCC TTGAGACCCA TGACCCCATA 
AGGGAATTTG ATTTTATAGG TTTTACTCTT CAGTATGAGA TGAGTTATAC AAACATAATA 
AATATGCTTG ACCTTGCGGG GGTGCCTGTT TTAAGCGGTG AGAGGACGAA AGAGCATCCC 
TTTGTCTGTG CCGGCGGTCC TTGTGCATAC AATCCGGAGC CTTTGGCAGA CTTTATAGAC 
TTTTTTATGA TGGGTGAAGG CGAGGAAATA ATCAACGAAG TGATGGATGT GTATGTACAA 
TGGAAGAAGA AAAATTTGCC AAGGGAAGAG TTTTTGCGCT GCATATCGTC AATTGAGGGA 
GTGTATGTCC CTCAATTCTA TGATGTAAAA TACAACGACG ATGGCACCAT AAGCTCTTTT 
TTGCCGATAA GGGATGAGTA TCCCAAAAAA ATAAGAAAAA GGATTATAAA GGACCTGGAC 
AAGGTCTTTT TCCCTGAAAA AATAGTAGTT CCCTTTACGG GAATCGTTCA TGACAGGATA 
ATGGTTGAGT TGTTCCGGGG CTGTATCAGG GGATGCAGAT TCTGTCAGGC AGGTTTTATT 
TACAGGCCTG TAAGGGAAAG ATCGGCGGAC AGGCTTTTGG AGATATCCCG AAAGCTTGAG 
GAAAGCACGG GTTATGAGGA GATTTCACTT ACTTCCTTAA GTACCAGTGA CTATACGGCG 
CTGAAAGAAC TAACCGACGG ACTGATTTGT GAGATGGAGC CGAAAAAAGT GAATCTTTCG 
CTTCCGTCTC TGAGGGTGGA TTCCTTTTCT CTTGAACTTA TGGAAAAGGC CCAGAAAGTT 
CGAAAAAGCG GTCTTACTTT TGCACCGGAA GCGGGTACCC AGAGGCTTCG CAATGTTATA 
AACAAGGGTG TAACCGAAGA AGACCTCATA AAATCTGTTT CTCTGGCTTT TGAAGGCGGC 
TGGAGCGGAG TAAAGCTTTA CTTTATGCTG GGGCTTCCGA CGGAAAGCTA TGAAGATATT 
GAGGGTATAG CGGAACTTGG ACATAAAGTT GTTGAAGCAT ATAAAAATAC GCCAAAAGAC 
AAAAGGGGCA AAGGACTTAG TGTCACTATC AGCACATCGT CCTTTGTTCC AAAGCCTTTT 
ACGCCTTTTC AGTGGGAGCC GCAGGACAGT ATCGAGACTT TGAGGGAAAA ACAGATTTTC 
CTGAAAAGCA AAATAAAAAG CAAGAGCATC AAGTACAACT GGCATGACCC TGAATTGAGC 
TTTTTGGAGG CAATTTTTGC CCGCGGAGAC AGAAAACTGG GTAAAGTGCT GCTTAAGGCT 
TTTGAGAAAG GCTGCAAGTT TGACAGTTGG GGAGAGCACT TCAAATTTGA CAAATGGATG 
GAGGCTTTCC GTGAATGCGG AATTGACCCT TCATTCTATG CCAACAGGAA AAGGTCATAT 
GGTGAGATTT TGCCTTGGGA TCATATTGAT GTGGGAGTGT CGAAGAAATT TTTGGAAAGA 
GAACATGAAA AGGCATTAAA AGAAGAAGTT ACTCCAAATT GCAGAGCAAA CTGTTCCGGA 
TGCGGAGCCA CCGTGTTTGA GGGGGGAATT TGTGTTGAGT AG

Protein sequence

MGIRVSDRIL QSVEKPSRYT GNEWNSVKKD LKGIDIRFAF CFPDVYEVGM SHLGMKILYH 
LLNEREDTYC ERVFAPWVDM EAKMREHNIP LFALETHDPI REFDFIGFTL QYEMSYTNII 
NMLDLAGVPV LSGERTKEHP FVCAGGPCAY NPEPLADFID FFMMGEGEEI INEVMDVYVQ 
WKKKNLPREE FLRCISSIEG VYVPQFYDVK YNDDGTISSF LPIRDEYPKK IRKRIIKDLD 
KVFFPEKIVV PFTGIVHDRI MVELFRGCIR GCRFCQAGFI YRPVRERSAD RLLEISRKLE 
ESTGYEEISL TSLSTSDYTA LKELTDGLIC EMEPKKVNLS LPSLRVDSFS LELMEKAQKV 
RKSGLTFAPE AGTQRLRNVI NKGVTEEDLI KSVSLAFEGG WSGVKLYFML GLPTESYEDI 
EGIAELGHKV VEAYKNTPKD KRGKGLSVTI STSSFVPKPF TPFQWEPQDS IETLREKQIF 
LKSKIKSKSI KYNWHDPELS FLEAIFARGD RKLGKVLLKA FEKGCKFDSW GEHFKFDKWM 
EAFRECGIDP SFYANRKRSY GEILPWDHID VGVSKKFLER EHEKALKEEV TPNCRANCSG 
CGATVFEGGI CVE