Gene CPF_1666 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1666
Symbol	thiI
ID	4201576
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	1882859
End bp	1884016
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	31%
IMG OID	638082541
Product	thiamine biosynthesis protein ThiI
Protein accession	YP_696105
Protein GI	110801269
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0301] Thiamine biosynthesis ATP pyrophosphatase
TIGRFAM ID	[TIGR00342] thiazole biosynthesis/tRNA modification protein ThiI

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.357019
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAATT TAATTTTAGT AAAATATGCC TCAGAAATAT TTTTAAAGGG GCTTAATAAA 
AATAAGTTTG AGAGAAAATT AAAAGAAAAT ATAAGAAAAA AGTTAAAAGA TATAGATCAT 
GAATTTATAA CAGATCAAAA TAGATGGTTC ATAAAATCAG AAGACTTAGA TGGAGTTATT 
GAAAGGGTAA AAAAGGTTTT TGGAGTTAAA GAACTTTGCT TAGTTACTCA GGTTGAAGGG 
GACTTTGATT CAATAAAAGA AGAGGGATTA AAGAAAATTA AAGAAAGCAA AGCTAAGAGT 
TTCAAAGTAG AAACAAATAG AGCTAATAAA AAATTCCCGA TGAATTCTAT GGAGGTTTCA 
AGAGCTGTTG GAGGATATAT CCTTTCAGAA CTTGGGGATG AAATAGAAGT TGATATACAT 
AATCCAGAGT GTAAGCTTTA TGTAGAAATA AGAGGAAATG CTTATGTGTT TACTGATAAA 
GATAAAATAA AGGCTGTAGG AGGCTTACCA TATGGAATGA ACGGAAGTAC TATGGTTATG 
TTATCAGGAG GAATTGATTC ACCAGTAGCA GCTTATTTAA TGGCTAGAAG AGGAGTTGAA 
ACTCATTGTG TATATTATCA TTCTCATCCA TACACTTCAG AAAGAGCTAA GGATAAGGTT 
AAGGAATTAG CAAAAATAGT AGGAAGATAC ACAGAAAAAA TAACTCTTTA TGTGGTTCCT 
TTTACAGAAA TACAAATGGA TATAATAGAG AAGTGTAGAG AAGATGAATT AACAATAATA 
ATGAGAAGAT TCATGATGAG AGTGGCTTGT GAACTTTCTG AAAGAAAGAA AATACAGTCA 
ATAACTACTG GAGAAAGTAT AGGGCAAGTG GCATCTCAGA CTATGGAAGG ACTTATGGTA 
AGTAATGATG TTTCAGATAG ACCAGTATTT AGACCTCTAA TAGCTATGGA TAAAGAGGAT 
ATAATGGATA TTGCAAGAGA TATAGATACT TATGAGACAT CAATACTTCC ATATGAAGAT 
TGTTGTACAA TATTTGTACC AAAACATCCA AAGACTAAGC CTAGAGTTAA GGACATGATA 
ATAGCAGAAA GAAAGCTTGA TATAGAAGCT TTAGTAAATA AAGCTATTGA TGAAATGGAA 
ACTTTCATAT TTGAATAA

Protein sequence

MNNLILVKYA SEIFLKGLNK NKFERKLKEN IRKKLKDIDH EFITDQNRWF IKSEDLDGVI 
ERVKKVFGVK ELCLVTQVEG DFDSIKEEGL KKIKESKAKS FKVETNRANK KFPMNSMEVS 
RAVGGYILSE LGDEIEVDIH NPECKLYVEI RGNAYVFTDK DKIKAVGGLP YGMNGSTMVM 
LSGGIDSPVA AYLMARRGVE THCVYYHSHP YTSERAKDKV KELAKIVGRY TEKITLYVVP 
FTEIQMDIIE KCREDELTII MRRFMMRVAC ELSERKKIQS ITTGESIGQV ASQTMEGLMV 
SNDVSDRPVF RPLIAMDKED IMDIARDIDT YETSILPYED CCTIFVPKHP KTKPRVKDMI 
IAERKLDIEA LVNKAIDEME TFIFE