Gene CPR_1181 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1181
Symbol	tdcB
ID	4205420
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	+
Start bp	1330239
End bp	1331447
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	30%
IMG OID	642565737
Product	threonine dehydratase
Protein accession	YP_698503
Protein GI	110802155
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR01127] threonine dehydratase, medium form

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000071198
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATTATTT TGTATTTAGA AAAAATTATT AAAGCCAAAA AAAATATAGA AGATGTAGTC 
ATAAAAACAC CTTTAATATA TAGCGAGGTC TTTTCAAGGA AATCTGGAAA CCAAGTGTAT 
ATGAAATGTG AAAATTTACA ATTAACAGGT GCTTACAAAA TAAGAGGTGC TTTAAATAAA 
ATAAGATCTT TATCAGATGA AGAAAAATCA AAAGGTGTTG TTTGTTCTTC TGCCGGAAAT 
CATGCTCAAG GCGTAGCTTT TGCAGCATCA CAAGCTAATG TTAAATCAAC TATAGTAATG 
CCAAAGACTA CTCCTCTACT AAAAATCCAA TCAACAAAGG ATTTAGGAGG GAATGTTGTT 
TTATCAGGTT ATGTTTATGA TGATGCTTTT AATGAGGCTA AAAGAATTGA ACAAGAACAA 
GGAGCCTTAT TTATACATCC ATTTAATGAT ATTGATGTAA TTTGTGGACA AGGTACAGTA 
GCCTTAGAAA TATTTGAAGA TTTAAATGAT GTAGATATTA TTCTCTGCCC TATAGGTGGC 
GGTGGCTTAA TAAGTGGAGT TACCCTAGCT GCTAAGGCTT TAAATCCTAA TGTTAAAGTA 
ATTGGAGTAC AGGGTGAAGG TGCAAATGCA ATGGTTAAAA GTTTTAAGGC AGGAGAAATA 
ATTGCTTTAG ACGCTGTTGA TACTATTGCT GATGGAATTG CAGTAAAAAG ACCTGGTGAT 
TTAACATTTA AATTTATAAA AGAATATGTT GATGATATAA TAACTGTATC AGATCATGAA 
ATTGTTGAAG CATTCTTTAC ATTAAGTGAA AAACATAAAC TTTTAGCAGA AGCTTCAGGA 
GCAGTCTCAT TAGCAGCTTC TGCTAAATTA AATTGTAAAG ATAAAAATAT AGTATCAGTA 
ATAAGTGGTG GTAATATAGA TATGGTTACT ATAACTTCAT TAATAAACAG CGCATTAGTA 
GCTAAAGGAA GACTTTTTGG ATTTAGTTTA GAAGTTCCTC ATAAACCAGG ACAAATATTG 
AAGATTGCTA AAGTTCTTGC TGATACTAAT GCTAATATAG TAAAACTTGA ACATGATCAT 
TTTAAAGCAA GGGATGCTCT TAAAAATATG GTTATAGAAG TAACTTTAGA GACAAATGGA 
CACTCTCACA TAGAGGAAAT AAAAAAAGCT TTAACAGATC AAAATTATGT AATAAAACAA 
ATTTATTAA

Protein sequence

MIILYLEKII KAKKNIEDVV IKTPLIYSEV FSRKSGNQVY MKCENLQLTG AYKIRGALNK 
IRSLSDEEKS KGVVCSSAGN HAQGVAFAAS QANVKSTIVM PKTTPLLKIQ STKDLGGNVV 
LSGYVYDDAF NEAKRIEQEQ GALFIHPFND IDVICGQGTV ALEIFEDLND VDIILCPIGG 
GGLISGVTLA AKALNPNVKV IGVQGEGANA MVKSFKAGEI IALDAVDTIA DGIAVKRPGD 
LTFKFIKEYV DDIITVSDHE IVEAFFTLSE KHKLLAEASG AVSLAASAKL NCKDKNIVSV 
ISGGNIDMVT ITSLINSALV AKGRLFGFSL EVPHKPGQIL KIAKVLADTN ANIVKLEHDH 
FKARDALKNM VIEVTLETNG HSHIEEIKKA LTDQNYVIKQ IY