Gene Cthe_0783 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0783
Symbol
ID	4810401
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	946308
End bp	947750
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	41%
IMG OID	640106200
Product	RNA modification protein
Protein accession	YP_001037211
Protein GI	125973301
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0621] 2-methylthioadenine synthetase
TIGRFAM ID	[TIGR00089] RNA modification enzyme, MiaB family [TIGR01574] tRNA-N(6)-(isopentenyl)adenosine-37 thiotransferase enzyme MiaB

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAGTAAGG GTACAAGGGA CAGGAAAAAT ATTTATGTTT CTCCGGAGGA AATGGCAAGA 
CAGCAGCGGT TTATTGACGA GATTAAAGAA TTAAACTATC GGAAGGAAGT AAAGACCGGA 
AAGAAGAAGC TTTATTGTCT TAATACTTTC GGTTGCCAGA TGAATGAACA TGATTCGGAG 
AAACTTGCGG GAATGTTGGC TGAAATGGGA TATGCTGAAA CGGATAACGT AAACGAAAGC 
GATTTGGTTA TTTACAATAC ATGCTGCGTA AGGGAAAATG CCGAGCTTAA GGTATACGGG 
CATCTTGGAA TGTTAAAGCC CCTTAAAAAT CAAAAACCGG ATCTTGTGAT CGCTGTATGC 
GGTTGTATGA TGCAGCAGCC GGAAGTTGTG GAGCATATAA AGAAGACATA CAGTCATGTT 
GACCTGATAT TTGGAACGCA CAACCTGTAT AAGTTTCCTG AGCTTTTGTA CAGTGCGATG 
GATTCTCAGA CAACTGTTGT TGATGTCTGG GATTGCGACG GCCAAATAGC TGAAAATGTG 
GCAATTGAGA GAAAAGACGG GGTGAAGGCC TGGGTTACGG TAATGTACGG CTGCAATAAT 
TTTTGCACCT ATTGTATTGT TCCTTACGTA CGAGGCAGGG AAAGAAGCAG ATCAATGGAT 
GACATTCTTG AAGAAGTAAG GATGTTAGGA CGTCAAGGGT TTAAGGAGAT AACACTTCTG 
GGGCAGAATG TAAACTCTTA CGGAAAAGAC ATTGGAGACG GTACAAGTTT TGCCGAGTTG 
ATACGTGAGG TTAACAAGAT ACCCGGGATT GAAAGAATCA GGTTTACCAC ATCCCATCCG 
AAAGATTTGT CCGATGATTT GATTTATGCC ATGAGAGACT GTGAAAAGGT ATGTGAACAT 
TTGCATCTTC CGTTTCAGGC GGGAAGCACC AGAATACTGA AATTGATGAA CAGAAAGTAT 
ACCAAGGAGG ATTATATTAA TCTTGTAGCA AAGATTAAGG AAAATATACC GGATATTGCA 
CTTACCACTG ATATTATCGT GGGATTTCCC GGTGAGACGG AGGAAGATTT CTCAGACACA 
CTGGATATTC TTGAAAAAGT CAGATTTGAC AACGCATATA CTTTCCTGTA TTCAAAGAGA 
ACCGGTACGC CTGCGGCCAA AATGGAGGAT CAGGTTCCGG AAGAAGTGAA GAAGGAAAGA 
TTCCAGAGAC TTCTTGAAAC GCAGAACAGG ATAAGCAAGG AAATAAATGA CACTTTTTTG 
GGCAAAGTGG TTGAAGTTCT TGTTGAGGGT GTCAGCAAGA CAAATGATAA GATTTTTACA 
GGAAGGACAA GGGGAAACAA AGTTGTTAAT TTTGAGGCTG ATGCAAGTTT GATAGGTAAG 
TTGGTGAATG TAAGAATAAA TACTGTAAAA ACTTGGTCGC TGGAGGGCAG CATAGTAAGG 
TGA

Protein sequence

MSKGTRDRKN IYVSPEEMAR QQRFIDEIKE LNYRKEVKTG KKKLYCLNTF GCQMNEHDSE 
KLAGMLAEMG YAETDNVNES DLVIYNTCCV RENAELKVYG HLGMLKPLKN QKPDLVIAVC 
GCMMQQPEVV EHIKKTYSHV DLIFGTHNLY KFPELLYSAM DSQTTVVDVW DCDGQIAENV 
AIERKDGVKA WVTVMYGCNN FCTYCIVPYV RGRERSRSMD DILEEVRMLG RQGFKEITLL 
GQNVNSYGKD IGDGTSFAEL IREVNKIPGI ERIRFTTSHP KDLSDDLIYA MRDCEKVCEH 
LHLPFQAGST RILKLMNRKY TKEDYINLVA KIKENIPDIA LTTDIIVGFP GETEEDFSDT 
LDILEKVRFD NAYTFLYSKR TGTPAAKMED QVPEEVKKER FQRLLETQNR ISKEINDTFL 
GKVVEVLVEG VSKTNDKIFT GRTRGNKVVN FEADASLIGK LVNVRINTVK TWSLEGSIVR