Gene Cthe_0150 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0150
Symbol
ID	4808708
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	189867
End bp	191171
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	41%
IMG OID	640105561
Product	RNA modification protein
Protein accession	YP_001036584
Protein GI	125972674
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0621] 2-methylthioadenine synthetase
TIGRFAM ID	[TIGR00089] RNA modification enzyme, MiaB family [TIGR01579] MiaB-like tRNA modifying enzyme

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.839753
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGGG CTGCATTCTA TACGTTAGGC TGCAAAGTAA ATCAGTATGA GACTGAGGCA 
ATTTCCGAAA TGTTTGAAAA AGCGGGCTAC AAGATAGTAG ACTTTGAAGA TGAAGCCGAT 
GTTTATGTAA TAAATACATG CACCGTTACA AATTTGAGTG ACCGAAAGTC ACGGCAAATG 
ATAAGGAGAG CAAAAAGAAA CAACGAAAAT TCCATAGTTA TTGTGATAGG CTGTTATGCC 
CAAACCGCTC CTGAGGAAGT AAGCAAAATC GAAGGAGTAA ACTTGGTCGT GGGGACCAAG 
GACCGAAGCA GGATTTTGGA GTATCTTAAG GAATTGGAGA CTTCCGGCGG CCGGCGAAAT 
TACGTCGGGG ACATAATGAA AACCCGGGAA TTTGAGGAAT TGGGTGTTAA TGTATACAAG 
GAGCGTACAA GGGCTTTCAT TAAGATACAG GAAGGTTGCA ATCAGTTTTG CACATACTGC 
ATTATTCCCT ATGCAAGAGG GCCTGTAAGA AGCCGCTCGG AGGAGAATAT ACTGAAGGAA 
GTGTCAGGAC TTGCACACAG TGGGTATAAA GAAGTGGTGC TTACCGGAAT ACATGTTGCA 
TCTTATGGAA AAGATATAAA GAATACTTCT TTGATTGATA TTATAAGAAA AGTACATGAA 
ATAGAAGGAA TAGAAAGAAT AAGGCTTGGT TCCATCGAAC CTACGACGGT GACGGAAGAA 
TTTGTCAGAG CGATAAAGGG AATGGAAAAA TTATGTCCGC AGTTTCATAT TTCTCTTCAA 
AGCGGGTGTG ACAGTACTTT AAAAAGAATG AACCGAAAAT ATACCACTAA AGAGTATTTA 
AGGTCTGTGG AGCTTTTGAG GGAAAATTTG AAGGATGTGG CCGTGACAAC TGATGTTATG 
GTTGGCTTTC CCGGGGAGAC TGACGAGGAG TTCAATGAAA CATGCAGGTT TGTCGAAAAA 
GTTCTTTTTG CAAGGATGCA TGTATTCAAA TATTCCCGCA GGAAAGGCAC GCCGGCGGCA 
TCTTATCCTG ACCAGGTTGC GCCGCAGAAA AAAGAAGAAA GAAGCCGCAT ATTGATTGAG 
CTTGCTTCCC GAATGACTTT GGAATACAAC AAAAGTTTCA CAGGCAGGGT TTTGCCGGTG 
TTGTTTGAAC AGGAAGTAAA AGGAAAAGAA GGATTTATGG AAGGGCTTAC ACCGAATTAT 
ATAAGGGTTG AATGCAAAGG TGATAAAGAT ATTGAGGGTC AAATTTTAAA TGTGCTTTTA 
AGAGAGGCAA AAGATGATTA TATTGTCGGA GAGATTGTAA ATTGA

Protein sequence

MKRAAFYTLG CKVNQYETEA ISEMFEKAGY KIVDFEDEAD VYVINTCTVT NLSDRKSRQM 
IRRAKRNNEN SIVIVIGCYA QTAPEEVSKI EGVNLVVGTK DRSRILEYLK ELETSGGRRN 
YVGDIMKTRE FEELGVNVYK ERTRAFIKIQ EGCNQFCTYC IIPYARGPVR SRSEENILKE 
VSGLAHSGYK EVVLTGIHVA SYGKDIKNTS LIDIIRKVHE IEGIERIRLG SIEPTTVTEE 
FVRAIKGMEK LCPQFHISLQ SGCDSTLKRM NRKYTTKEYL RSVELLRENL KDVAVTTDVM 
VGFPGETDEE FNETCRFVEK VLFARMHVFK YSRRKGTPAA SYPDQVAPQK KEERSRILIE 
LASRMTLEYN KSFTGRVLPV LFEQEVKGKE GFMEGLTPNY IRVECKGDKD IEGQILNVLL 
REAKDDYIVG EIVN