Gene Cthe_0158 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0158
Symbol
ID	4808646
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	197773
End bp	199266
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	41%
IMG OID	640105569
Product	ribonuclease G
Protein accession	YP_001036592
Protein GI	125972682
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1530] Ribonucleases G and E
TIGRFAM ID	[TIGR00757] ribonuclease, Rne/Rng family

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTAGTG AGATTGTGGT AGATGTGGGG ATTAATGAAA AAAGAGTGGC TCTGTTGGAA 
GACAGGGAAC TGGTTGAATT ATTTATAGAG AGAAATGATT GTGAAAGACT TGTGGGCAAT 
ATTTACAGAG GCAGAGTGGA AAGTGTCCTG CCTGGAATGC AGGCGGCTTT TATAGATATC 
GGATATGAAA AGAATGCTTT TTTGTATGTA GGTGATGCCA TACCTCAGAA AGAATTTTCC 
GAAGATGATG AAGAAATCTA TAGCGATGTT AAGAGTTACA ATATCGAAGA GATATTAAGA 
CCCGGTCAGG AAATAACGGT ACAGGTAACC AAAGAACCCA TAGGAACAAA AGGCCCAAGG 
GTAACTACCC ATATAACGTT GCCGGGAAGG CAGATGGTGC TTCTTCCCAA CGCCGATTAC 
ATTGGCATTT CTAGGAGAAT TGAGGATGAG GAGGAACGGG CAAAGCTAAG AAAAATAGCC 
GAAAAGATCA AACCAAAGAA TATGGGAATT ATTGTAAGGA CTGTTTCGGA AGGCAAACGG 
GAAGAAGATT TTAAAAGTGA TTTGAATTTT TTGGTCAAAC TTTGGGCAAA AATAAAACAA 
AGAGAACAGA GCGGACCGGT TCCCAGGTGT TTGCACAAAG ATTTGAGTGT AATTTACAGA 
GCAGTCAGGG ACATCTTTAC ATGGAACATT GACAGGTTTG TTATTAATGA CCGGCAGGAG 
TACAATAAGG TTCTTGAGCT TGTTGAAATG ATTTCGCCGG CTTTGAAAAT GAGAGTGGAG 
TATTTCAACA AAAATATTGA TTTGTTTGAG TACTACCAGA TTGACAGCAT GATACAGAAG 
GCATTGGCCA AAAAGGTCTG GTTAAAATGC GGAGGATATA TTGTAATCGA GAGAACGGAA 
GCTCTTACGG TTATTGATGT GAACACCGGG AAGTATGTGG GGGTAAACAA TCTCGAAGAC 
ACCGTTTTAA GGACCAATCT TGATGCGGTC AAAGAAATCG GGAAACAATT GAGGCTAAGA 
GACATCGGAG GAATAATTAT TATTGATTTT ATCGACATGC ATGATCCGGA ACATCAAAAA 
CAGGTACTGG AAGCTTTAAA GCAGGTATTG AAAAAGGATC GCACCAAAAC CACTGTTGTC 
GGCATGACCG GTCTTGGCCT TATTGAGATG ACGAGGAAAA AGGTTAGGGA AGGCTTGGAG 
TCAATGATGC TTCAGGATTG TCCTTATTGT GAAGGAAGGG GGAAAATACT TTCGCCCGAG 
TCTGTGGCAA GAAATGTTGA GAAAGAGATA AGCAAATACT TTACAAAAAC AATAGCAAAT 
GCTATCATGG TTGAGGTTCA TCCTACTGTG GCCGAGGTGT TGAGAGGAGA AGACAACGAC 
AACCTTGCAA GAATTCAGAA TCTGTTTAAC AAAAAAGTCA TAATAAAACC CTCGGCGGAA 
GTGGGACATG AGGAAGTGAA GGGAAGTTGT AAAATAAAAT GCCGTAATAT ATAG

Protein sequence

MVSEIVVDVG INEKRVALLE DRELVELFIE RNDCERLVGN IYRGRVESVL PGMQAAFIDI 
GYEKNAFLYV GDAIPQKEFS EDDEEIYSDV KSYNIEEILR PGQEITVQVT KEPIGTKGPR 
VTTHITLPGR QMVLLPNADY IGISRRIEDE EERAKLRKIA EKIKPKNMGI IVRTVSEGKR 
EEDFKSDLNF LVKLWAKIKQ REQSGPVPRC LHKDLSVIYR AVRDIFTWNI DRFVINDRQE 
YNKVLELVEM ISPALKMRVE YFNKNIDLFE YYQIDSMIQK ALAKKVWLKC GGYIVIERTE 
ALTVIDVNTG KYVGVNNLED TVLRTNLDAV KEIGKQLRLR DIGGIIIIDF IDMHDPEHQK 
QVLEALKQVL KKDRTKTTVV GMTGLGLIEM TRKKVREGLE SMMLQDCPYC EGRGKILSPE 
SVARNVEKEI SKYFTKTIAN AIMVEVHPTV AEVLRGEDND NLARIQNLFN KKVIIKPSAE 
VGHEEVKGSC KIKCRNI