Gene CPR_1011 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1011
Symbol	dhaT
ID	4206140
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	+
Start bp	1151232
End bp	1152389
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	35%
IMG OID	642565568
Product	1,3-propanediol dehydrogenase
Protein accession	YP_698334
Protein GI	110803773
COG category	[C] Energy production and conversion
COG ID	[COG1454] Alcohol dehydrogenase, class IV
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000128902
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAATGT ACGATTATTT AGTACCAAGT GTAAACTTTA TGGGAGCTAA CTCAATATCA 
GTAGTTGGTG AAAGATGTAA AATATTAGGT GGAAAGAAAG CTTTAATAGT TACAGATAAA 
TTCTTAAGAG GATTAAAAGG GGGAGCAGTT GAATTAACTG AAAAATACCT AAAAGAAGCA 
GGAATCGAAG TTGCTTATTA TGATGGAGTT GAACCAAATC CAAAAGATAC AAATGTTAAA 
GATGGTTTAA AAATATTCAA AGACGAAAAC TGTGATATGA TAGTTACAGT TGGTGGAGGA 
AGCTCACATG ACTGTGGTAA AGGAATAGGT ATAGCTGCAA CTCACGAAGG AGATCTTTAT 
GACTATGCTG GAATAGAAAC TTTAACAAAT CCACTTCCTC CAATAGTAGC AGTAAACACT 
ACAGCTGGAA CTGCAAGTGA AGTAACTAGA CACTGTGTTA TAACAAACAC TAAAACTAAA 
GTTAAATTCG TTATAGTAAG CTGGAGAAAC TTACCTTTAG TTTCAATCAA TGACCCAATG 
TTAATGGTTG GAAAACCAGC AGGATTAACA GCTGCAACAG GAATGGACGC TTTAACTCAT 
GCTGTAGAAG CATATGTATC AAAAGATGCT AACCCTGTAA CAGATGCTGC TGCAATACAA 
GCTATAAAAT TAATATCAAG CAATTTAAGA CAAGCTGTTG CTTTAGGAGA AAACTTAGTA 
GCTAGAGAAA ACATGGCTTA CGGTTCATTA TTAGCTGGTA TGGCATTTAA CAATGCTAAC 
TTAGGATATG TACATGCTAT GGCTCACCAA TTAGGCGGAT TATATGATAT GCCTCACGGA 
GTAGCTAACG CTATGTTATT ACCACACGTA TGTAAATACA ACTTAATATC TAACCCACAA 
AAATTTGCTG ATATAGCTGA ATTCATGGGA GAAAACATAG AAGGATTATC AGTAATGGAT 
GCTGCTCAAA AAGCTATAGA TGCAATGTTC AGATTATCAA CTGATATCGG AATACCAGCA 
AAATTAAGAG ACATGGGAGT AAAAGAAGAA GACTTCGGAT ACATGGCTGA AATGGCTCTT 
AAAGATGGTA ATGCATTCAG TAACCCAAGA AAAGGTAACG AAAGAGACAT CGTTGAAATA 
TTCAAAGCTG CATTCTAA

Protein sequence

MRMYDYLVPS VNFMGANSIS VVGERCKILG GKKALIVTDK FLRGLKGGAV ELTEKYLKEA 
GIEVAYYDGV EPNPKDTNVK DGLKIFKDEN CDMIVTVGGG SSHDCGKGIG IAATHEGDLY 
DYAGIETLTN PLPPIVAVNT TAGTASEVTR HCVITNTKTK VKFVIVSWRN LPLVSINDPM 
LMVGKPAGLT AATGMDALTH AVEAYVSKDA NPVTDAAAIQ AIKLISSNLR QAVALGENLV 
ARENMAYGSL LAGMAFNNAN LGYVHAMAHQ LGGLYDMPHG VANAMLLPHV CKYNLISNPQ 
KFADIAEFMG ENIEGLSVMD AAQKAIDAMF RLSTDIGIPA KLRDMGVKEE DFGYMAEMAL 
KDGNAFSNPR KGNERDIVEI FKAAF