Gene Cthe_0958 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0958
Symbol
ID	4811251
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1146176
End bp	1147300
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	44%
IMG OID	640106377
Product	queuine tRNA-ribosyltransferase
Protein accession	YP_001037385
Protein GI	125973475
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0343] Queuine/archaeosine tRNA-ribosyltransferase
TIGRFAM ID	[TIGR00430] tRNA-guanine transglycosylase, queuosine-34-forming [TIGR00449] tRNA-guanine transglycosylases, various specificities

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0452051
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGCTA TAAGGTATGA GCTTATAAAA AAGTGTAAAC AGTCCGGTGC CCGGTTGGGA 
AGAGTATACA CTCCCCATGG ATGTTTTGAC ACCCCGGCTT TTATGCCGGT GGGAACGCAG 
GCAACCGTTA AAGGTATGTC TCCGGATGAA ATGAAAGAAA TTGAGGCCCA GATAATATTG 
AGCAATACCT ATCATCTTCA TATGAGGCCG GGAGAGGATA TTGTAAAAGA GGCCGGCGGT 
CTTCACGGTT TTATGAACTG GGACAGGCCG ATTCTTACGG ACAGTGGCGG CTTTCAGGTT 
TTCAGCCTCA GTGATTTGAG GGATATCAAG GAGGAAGGTG TGACTTTCAA GTCGCATATT 
GACGGTTCGA AGCATTTTAT TTCTCCGGAG ATGGCGATAA AAATACAGAA TGACCTTGGA 
GCCGACATCA TAATGGCTTT TGACGAATGT ATTCCATATC CTGCGGATTA TGACTATGCA 
AAAAAGTCAT TGGAGAGAAC CACACGATGG GCCAAAAGAT GCAAGGATGC TCATAGAAAT 
CCGGAAAAAC AGGCTCTTTT CGGAATTGTC CAGGGTGGAA TGTACAAAGA TTTAAGACAG 
CAGAGTGCCT ATGAATTGCT GGAACTGGAT TTCCCGGGAT ATGCCATTGG AGGATTGAGT 
GTGGGGGAGC CTGCGGAGAT TATGTATGAA ATGCTGGAGG TTACGGTTCC GCTGCTTCCT 
GAGGACAAGC CAAGATATTT GATGGGAGTG GGAAGTCCGG ATTATCTGAT TGAGGGAGCC 
ACCAGGGGAA TTGACATGTT TGATTGCGTG CTTCCGACAA GAATCGGCAG AAACGGTACG 
GTTCTGACCA GCAAAGGAAG AATAATAGTT AGAGATGCAA TCTATGCGAG GGATTATACT 
CCCATAGATC CGGAATGCGA TTGTTATGCC TGCAGGAATT TTACCCGGGC GTATATAAGG 
CATCTTTTAA AAAGCGGGGA AGTTCTTGGA ATAAGACTTA CCACATGGCA TAACTTAAGA 
TTTTTGATTA ACCTTATGAA AAAAGTAAGA CAGGCTATAA TGGAAGACAG GCTTTTAGAT 
TTCAGAGATG AGTTTTTCAG TAAATTCGGA TATAAAAAAA TATAG

Protein sequence

MSAIRYELIK KCKQSGARLG RVYTPHGCFD TPAFMPVGTQ ATVKGMSPDE MKEIEAQIIL 
SNTYHLHMRP GEDIVKEAGG LHGFMNWDRP ILTDSGGFQV FSLSDLRDIK EEGVTFKSHI 
DGSKHFISPE MAIKIQNDLG ADIIMAFDEC IPYPADYDYA KKSLERTTRW AKRCKDAHRN 
PEKQALFGIV QGGMYKDLRQ QSAYELLELD FPGYAIGGLS VGEPAEIMYE MLEVTVPLLP 
EDKPRYLMGV GSPDYLIEGA TRGIDMFDCV LPTRIGRNGT VLTSKGRIIV RDAIYARDYT 
PIDPECDCYA CRNFTRAYIR HLLKSGEVLG IRLTTWHNLR FLINLMKKVR QAIMEDRLLD 
FRDEFFSKFG YKKI