Gene CPF_0670 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0670
Symbol	thiC
ID	4201374
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	797635
End bp	798945
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	32%
IMG OID	638081555
Product	thiamine biosynthesis protein ThiC
Protein accession	YP_695123
Protein GI	110798961
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0422] Thiamine biosynthesis protein ThiC
TIGRFAM ID	[TIGR00190] thiamine biosynthesis protein ThiC

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTATA CAACTCAAAT GGATGCTGCT AAAAAAGGAA TAATAACAAA GGAAATGCAA 
GTAGTTTCAG AAAAAGAAGG AATTAATATT GAAACTTTAA TGAATTTAAT GGCTGAAGGA 
AAAATTGTAA TACCAGCTAA TAAAAATCAT AAAAGTATAA GTGCAGAAGG TGTTGGACAA 
GGGTTAAGAA CTAAAATAAA TGTTAACCTA GGAATTTCAA AGGACTGTGC CAATATAGAA 
TTAGAGTTAG AAAAAGTTAA AAAAGCAATA GATATGAATG CAGAATCTAT AATGGATTTA 
AGTAATTATG GTAAAACTTA TGATTTTAGA AAAAGACTTG TAGAAGTTTC TACGGCTATG 
ATAGGAACTG TACCAATGTA TGATGTAGTA GGTTTCTATG ATAAAGAGCT TAAAGATATA 
ACTGTTGATG AATTTTTTGA AGTTGTAGAA AAACATGCAA AGGATGGAGT TGACTTTGTT 
ACTATACATG CTGGATTAAA TAGAGAAACA ATTGAAACTT TTAGAAGAAA TAAAAGACTT 
ACTAATATAG TTTCTAGAGG AGGATCTCTT CTTTTTGCAT GGATGGAATT AAATAATAGA 
GAAAATCCTT TCTATGAATA TTTTGATAGA TTATTAGATA TATGTGAAAA GTATGATTTA 
ACTTTAAGTT TAGGGGATGC TTGTAGACCA GGTTCAATAG CTGATGCAAC TGATGCTGTA 
CAAATCAAAG AATTAATTAC TCTTGGAGAG CTAACAAAAA GAGCTTGGGA AAGAAATGTA 
CAAGTAATAA TAGAGGGTCC AGGGCATATG GCAATGAATG AAATAGAAGC TAATGTTTTA 
TTAGAGAAAA AATTATGCCA TGGAGCACCA TTTTATGTTT TAGGACCAAT AGTAACTGAT 
ATTGCACCAG GATATGATCA TATAACAAGT GCTATAGGAG GGGCTATGGC AGCTTCTTAT 
GGAGCAGATT TTCTTTGTTA TGTAACACCA GCAGAACATT TAAGACTTCC TAATTTAGAG 
GATGTAAGGG AAGGAATAGT TGCCACAAAG ATAGCGGCTC ATGCAGCTGA CATAGCAAAA 
GGAATTTCTG GGGCAAGGGA CATAGATAAT AAAATGAGTG ATGCTAGGAA AAGACTAGAT 
TGGGACGAGA TGTTTTCTTT AGCTATAGAT AGTGAAAAAG CCATTAGATA TAGAAAAGAA 
TCTACTCCTG AACATAAAGA TAGTTGTACA ATGTGTGGAA AAATGTGCTC TATAAGAAAT 
ATGAATAAGA TTCTAGAAGG AAAGGATATA AATCTTTTAA GAGAAGACTA A

Protein sequence

MNYTTQMDAA KKGIITKEMQ VVSEKEGINI ETLMNLMAEG KIVIPANKNH KSISAEGVGQ 
GLRTKINVNL GISKDCANIE LELEKVKKAI DMNAESIMDL SNYGKTYDFR KRLVEVSTAM 
IGTVPMYDVV GFYDKELKDI TVDEFFEVVE KHAKDGVDFV TIHAGLNRET IETFRRNKRL 
TNIVSRGGSL LFAWMELNNR ENPFYEYFDR LLDICEKYDL TLSLGDACRP GSIADATDAV 
QIKELITLGE LTKRAWERNV QVIIEGPGHM AMNEIEANVL LEKKLCHGAP FYVLGPIVTD 
IAPGYDHITS AIGGAMAASY GADFLCYVTP AEHLRLPNLE DVREGIVATK IAAHAADIAK 
GISGARDIDN KMSDARKRLD WDEMFSLAID SEKAIRYRKE STPEHKDSCT MCGKMCSIRN 
MNKILEGKDI NLLRED