Gene Cthe_3076 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_3076
Symbol
ID	4809950
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	3617293
End bp	3618585
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	37%
IMG OID	640108500
Product	radical SAM family protein
Protein accession	YP_001039465
Protein GI	125975555
COG category	[R] General function prediction only
COG ID	[COG0535] Predicted Fe-S oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGTTA ATATAATTAA TATGTCAGCA ATTGTAAAAA TGATTGTGAG TTCATCGATT 
GTTAAAAAAA CATGGCAAAT TCATAAATTG TTTTCGGAGA ATGAGGAATA CAGTCTGAAA 
AATTTAATAA GAAGCATACA CCATTTATTA AAGTACGAAA GAATCTTGCA GCATCAGAAT 
ACGTTTGTGA TAAGCTCTTT TATTCCGCCG ATAAATACCA AAGCGTTTGG CAGCTTGTTT 
GACGGCATAC CTGGAAGCGG CGGGAATCTT TTTGAAAACT TTGTGAAAGG AAAAAGGAAG 
TTTCCCGTTT GGATAAATAT TGATATTACG TCAAGATATC CGAACAACAA ATATTTAGAC 
GGTGATAGCG GTTTTTCGGA AAGACATTTT AATGATATGG AAAGAGAAAA ACTCATATCT 
TTGATAAATG AGATACAGGA CATGGGTGTT GGAATTATAG GACTTGCCGG AGGAGAACCT 
TTACTTAGAA ATGACCTTGA AGAAATCGTT GAAAATATTG ATGACAGAAG TGTTTCTTAT 
GTCTATTCAA CAGGATACGG TTTGACCTCT CAAAGAGCGA GGGATTTAAA ATCGGCAGGC 
TTGTATGGCA TAATAATAGA TTTTCAATCA ATGAATGAAG GCGAACATGA TGAAAAAATG 
GGCTTTAACG GAGCTTATCA TTATGCCGTA AATGCAATTG AAAACTCAAA AAAAGCCGAG 
CTCTATACTG TTTCAAGGAC TTTCTGCAAC AGGGAGCTTT TAGAAAAGGA AACAATGCTA 
GAGTTTATAA AATTTCTTGG ACAGTGTGGA GTTGATGAAG TAAGATTGAT GGAGCCCATG 
CCTTTTGGAA AAAGCGGAAG AATAAGCCGG GATGAATTGT TTACTGATGA TGAACGAAAG 
AAACTGATTG AATTGCATAT GTTATGCAAC AAAGATGCGA ATTTGCCGAA GGTATCCGTT 
TGCTCTTACT TTGAATCCCG GGAGATGTTC GGATGCGGTG CTGCGGGATA CTATTCATTT 
ATTGATATAC ATGGTGATTT ATATCCGTGC GATTACATAC CCTTTAATTT TGGCAATGTT 
TTTGAAACTC CGATAAAGGC TTTATGGAAA AAGATGTATA AAAGTTTTGA AACGCCGGAA 
GTGCATTGCC GTTCGCTAAT TTGTCTTGGG AAAATGGAAC GGGATAAATT TCAACAATAT 
CCGCAAAGGG TGAAAACTTT GCCGGAAAGT TGCAAAACGT GCTGCGGGCA AGTCACACCG 
GGATTTTACA AAATACTTGG GGGAGAAAAG TAA

Protein sequence

MNVNIINMSA IVKMIVSSSI VKKTWQIHKL FSENEEYSLK NLIRSIHHLL KYERILQHQN 
TFVISSFIPP INTKAFGSLF DGIPGSGGNL FENFVKGKRK FPVWINIDIT SRYPNNKYLD 
GDSGFSERHF NDMEREKLIS LINEIQDMGV GIIGLAGGEP LLRNDLEEIV ENIDDRSVSY 
VYSTGYGLTS QRARDLKSAG LYGIIIDFQS MNEGEHDEKM GFNGAYHYAV NAIENSKKAE 
LYTVSRTFCN RELLEKETML EFIKFLGQCG VDEVRLMEPM PFGKSGRISR DELFTDDERK 
KLIELHMLCN KDANLPKVSV CSYFESREMF GCGAAGYYSF IDIHGDLYPC DYIPFNFGNV 
FETPIKALWK KMYKSFETPE VHCRSLICLG KMERDKFQQY PQRVKTLPES CKTCCGQVTP 
GFYKILGGEK