Gene CPR_1004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1004
Symbol	dhaB
ID	4206440
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	+
Start bp	1145256
End bp	1146920
Gene Length	1665 bp
Protein Length	554 aa
Translation table	11
GC content	35%
IMG OID	642565561
Product	glycerol dehydratase, alpha subunit
Protein accession	YP_698327
Protein GI	110802661
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG4909] Propanediol dehydratase, large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.872763
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAATCTA AAAGATTCCA AGTATTATCA GAACGTCCTG TAAACCAAGA TGGACTTATA 
GGAGAGTGGG CTGATGAAGG CTTAATAGCT TTAGATAGTC CAAATGATCC AAAATCATCA 
ATAAAAATAG AAAATGGAAT AATTACTGAA TTAGACGGTA GATCAAGAGA TGAGTTTGAT 
ATGATAGATA AATTTATAGC AGAGTACGCT ATAAATATAG AAGACGCAGA AGCATCTATG 
AAACTTTCAT CTAAAGAAAT AGCAAGAAGA TTAGTTGATA TAAATGTTAG TAGAGATGAA 
ATAGTAAAAA TCACTACTTC AATAACACCA ATGAAGGCTG TAGAAGTTAT TCAAGAAATG 
AACGTTGTTG AAATGATGAT GGCTCTTCAA AAAATGAGAG CAAGAAGAAC ACCTGCTAAC 
CAATGTCACG TTACTAACGT AAAAGACAAC CCAGTTCAAA TAGCAGCAGA TGCTGCAGAG 
GCTGCTTTAA GAGGATTTGC AGAGCAAGAA ACTACAGTAG GTATAGTTAG ATATGCACCT 
TTTAATGCAT TAGCTATCTT AGTAGGTTCA CAAGTAGGTA GAGGAGGAGT TTTAACTCAA 
TGTGCAGTTG AGGAAGCTAC TGAACTTGAC CTAGGAATGA GAGGACTTAC AAGTTATGCA 
GAAACAGTTT CAGTTTATGG AACAGAATCA GTATTTACAG ATGGAGATGA TACTCCATGG 
TCAAAAGCAT TCTTAGCATC AGCTTATGCT TCAAGAGGAC TTAAGATGAG ATTTACATCA 
GGTTCAGGTT CAGAAGCATT AATGGGATAC TCAGAAGGTA GATCAATGCT TTACTTAGAA 
TCAAGATGTA TATATATAAC TAAGGGAGCT GGAGTTCAAG GATTACAAAA TGGTGCAGTT 
AGTTGTATAG GTATGACAGG AGCAGTTCCA TCAGGAATAA GAGCAGTTCT TGGAGAAAAC 
TTAATAGCTG CAATGCTTGA TATAGAGGTT GCATCAGCAA ATGACCAAAC ATTCTCACAC 
TCAGACATAA GAAGAACAGC AAGAATGTTA ATGCAAATGC TTCCAGGAAC AGACTTCATA 
TTCTCAGGAT ATAGTGCAGT TCCAAACTAC GATAACATGT TTGCTGGATC AAACTTTGAT 
GCAGAAGACT TTGATGACTA CAACATACTT CAAAGAGACT TAAAAGTTGA CGGTGGATTA 
AGACCAGTTA CAGAAGAAGA AACTATAAAG GTTAGAAATA AAGCTGCCAA ATGCATACAA 
ATAATCTTTA GAGAATTAGG ATTCCCAGAA GTTACTGATG AAGAAGTAGA AGCTGCAACT 
TACTGTCACG GAAGTAAGGA AATGCCAAAC AGAAATGTAG TTGAAGATTT AAAGGCTGCA 
GAAGAAATGT TAGAAAGAAG AATAACAGGA TTAGATATAA TAAAAGCTTT AAGCAAAAAT 
GGTATGGAAG ATATAGCAAA CAATTTATTA AACATGCTTA AGCAAAGAGT TACTGGAGAT 
TATCTTCAAA CTTCAGCAAT CTTAGATAAA GATTTCAATG TTATAAGTGC TGTTAATGAT 
GTAAATGACT ATATGGGACC TGGAACAGGA TATAGACTAG ATGGTCAAAG ATGGGAAGAA 
ATCAAAAAAG TTCCTACAGT AATGAGACCA GAGGATATAG AGTAG

Protein sequence

MKSKRFQVLS ERPVNQDGLI GEWADEGLIA LDSPNDPKSS IKIENGIITE LDGRSRDEFD 
MIDKFIAEYA INIEDAEASM KLSSKEIARR LVDINVSRDE IVKITTSITP MKAVEVIQEM 
NVVEMMMALQ KMRARRTPAN QCHVTNVKDN PVQIAADAAE AALRGFAEQE TTVGIVRYAP 
FNALAILVGS QVGRGGVLTQ CAVEEATELD LGMRGLTSYA ETVSVYGTES VFTDGDDTPW 
SKAFLASAYA SRGLKMRFTS GSGSEALMGY SEGRSMLYLE SRCIYITKGA GVQGLQNGAV 
SCIGMTGAVP SGIRAVLGEN LIAAMLDIEV ASANDQTFSH SDIRRTARML MQMLPGTDFI 
FSGYSAVPNY DNMFAGSNFD AEDFDDYNIL QRDLKVDGGL RPVTEEETIK VRNKAAKCIQ 
IIFRELGFPE VTDEEVEAAT YCHGSKEMPN RNVVEDLKAA EEMLERRITG LDIIKALSKN 
GMEDIANNLL NMLKQRVTGD YLQTSAILDK DFNVISAVND VNDYMGPGTG YRLDGQRWEE 
IKKVPTVMRP EDIE