Gene Ccel_1683 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_1683
Symbol
ID	7310426
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	2026988
End bp	2028166
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	38%
IMG OID	643608611
Product	thiamine biosynthesis/tRNA modification protein ThiI
Protein accession	YP_002506014
Protein GI	220929105
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0301] Thiamine biosynthesis ATP pyrophosphatase
TIGRFAM ID	[TIGR00342] thiazole biosynthesis/tRNA modification protein ThiI

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAAAA AAATAATACT GGTACGTTAT GGAGAGATAA TATTAAAAGG TTTAAACAGG 
CCCGTTTTTG AAGATAAGCT TATTGGAAAT ATAAAGAGTG CTATTTTCAA ATTTGGAAAA 
GCTAGGGTAA TCAAATCACA AGGCAGAATT TATATTGAAC CTCAAGAAGA GAACTATGAC 
TTTGATTCAG TTCTTGTAAA AGTAACGAAA GTATTTGGTG TTGTTTCTGT AAGTCCTGTG 
TGGAAAGTTG AAACAGACTA TGAAATAATC AAGGATACTT CCCTAAAACT GGCTTCTAAA 
CTGGTAGAAG AAAAGAGCTA CAAGACATTC AAGGTAGAAA CAAAAAGAGG GAACAAGAGA 
TTTCCAATGC AGTCACCTGA AATCAGTGCT GATGTAGGAG GCTTTATTTT AGAAAATATT 
CCGCAGCTAT CAGTTGATGT CAAAAATCCT GATTTTATCA TATTTCTTGA AGTAAGAGAA 
AGTACTTATA TCTATTCAGA AATGATGAAG GCACAGGGAG GTATGCCTCT TGGGTCTAAC 
GGCAAAGCGA TGCTGCTTTT GTCGGGAGGA ATTGACAGTC CGGTTGCAGG TTGGATGATG 
GGTAAAAGAG GTGTGGAGAT TGAAGCCGTT CATTTCTTTA GCTACCCTTA TACAAGTGAA 
AGAGCAAAAC AAAAGGTAAT TGATCTGGCA CAAATAATGG CACAGTACTG CGGAAAAATT 
CGTCTGCACG TTGTTCCGTT TACCGAGATT CAACTAAAAA TCAACGATAA TTGCCCTGAG 
GAACAGCTTA CTATCATTAT GCGAAGGATT ATGATGAAAA TAGCGGAACA AATAGCTGTA 
AAAGTAAATG CCATGGCACT TATTACCGGG GAAAGTATGG GGCAAGTTGC CAGCCAGACC 
ATGCAGAGCC TTTACTGTAC GGATGCAGCA GTAAATATGC CGGTATTCAG GCCATTGATC 
GGTATGGACA AGGTTGAAGT GGTGGATATA GCTAGGAGAA TTGATACTTT TGATACTTCT 
GTTCTTCCAT ACGAAGATTG CTGTACTGTA TTTGTTGCAA AGCACCCTCA AACCAAGCCT 
AAGCTTGATA GAATAATAGA GTCAGAGTCA GTTGTTGACT TTGAACCACT TATAAATACC 
GCAATCGAAA ATACCGAAGT AATTGTTATA AAGCCATAG

Protein sequence

MNKKIILVRY GEIILKGLNR PVFEDKLIGN IKSAIFKFGK ARVIKSQGRI YIEPQEENYD 
FDSVLVKVTK VFGVVSVSPV WKVETDYEII KDTSLKLASK LVEEKSYKTF KVETKRGNKR 
FPMQSPEISA DVGGFILENI PQLSVDVKNP DFIIFLEVRE STYIYSEMMK AQGGMPLGSN 
GKAMLLLSGG IDSPVAGWMM GKRGVEIEAV HFFSYPYTSE RAKQKVIDLA QIMAQYCGKI 
RLHVVPFTEI QLKINDNCPE EQLTIIMRRI MMKIAEQIAV KVNAMALITG ESMGQVASQT 
MQSLYCTDAA VNMPVFRPLI GMDKVEVVDI ARRIDTFDTS VLPYEDCCTV FVAKHPQTKP 
KLDRIIESES VVDFEPLINT AIENTEVIVI KP