Gene Cphy_3041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_3041
Symbol
ID	5743367
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	3718159
End bp	3719544
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	37%
IMG OID	641294142
Product	aldehyde dehydrogenase
Protein accession	YP_001560137
Protein GI	160881169
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGAGA TAGAAACAGG GTATCAAAAA CTTGTAACAA ACCAAAGAGA ATTCTTTCGT 
ACTGGCAAGA CCAAACAAGT GGATTTTCGA ATTCAAGCAC TAAAGAAACT TCAGTCCGAG 
ATTAAAAATC GAGAAGCAGA AATAATGGAG GCTTTAAAGA AAGACCTAAA TAAATCAAGT 
TTTGAATCTT ATATGACAGA AATCGGTATG GTACTTGATG AAATCCGTCA TTGTATCGCA 
CATGTGAAAA AGTGGTCCAA ACCAAAGAGT GTTAAAACTC CACTTGCGCA ATTTCCTTCA 
AAGAGTTTTA CCATATCGGA ACCATATGGT GTTGTACTAA TTATGTCTCC TTGGAATTAT 
CCATTTCAAT TATGCATAGA ACCATTAATT GGTGCTATTA CAGCAGGAAA CTGTGCAGTA 
TTAAAGCCGT CCGCATATGC AGCAGAAACG TCTAAAGTAA TCAATACCTT AATACGTGCT 
TGCTTTCCAA AGGAGTACGT TACGGTAATT GAAGGCGGTA GAAAAGAGAA TCAGGGATTA 
CTGGCTACGA GATTTGATTA TATCTTCTTT ACCGGTGGTG TCGAAGTCGG AAAGATTGTT 
ATGGAAGCAG CAGCTCAATT CCTAACTCCA GTGTCATTAG AGCTTGGAGG TAAGAGCCCT 
TGTATTATTG AGAAATCAGC AGATATCAAT CTTGCTGCAA AGCGTGTTGC TTTTGGAAAG 
TATCTCAATG CTGGTCAGAC ATGTGTTGCA CCTGATTATG TTTTCGTTCA GAAAGAAGTG 
GAAGAGGAAT TTTTTAAGAA ATTAGGGTTG TGGGTACACA AATTCTTTGG TGAAGAACCT 
TTAAAGAATG AAAATCTTCC GAAAATTATT AATGAACATC ATTATCATAG ATTACTTTCC 
CTTCTTGAGG GAGAAGATAT TGTCATCGGT GGAAAAGGAC AGGATAATAT AAGAAAGATT 
GAACCTACGG TACTAAAAAG TGTATCAACG GATTCCAATA TAATGCAAGA AGAAATTTTT 
GGACCGATTC TCCCTGTACT TAGCTATAAG ACAATAGAGG AAGTAATAGA GTATGTCACA 
GCACACGAAA AGCCATTGGC ATGCTATTTA TTTACAACGA ATGTACAGAT AGAAAAGAAA 
GTATTAAAGC ACGTTTCTTT TGGTGGTGGA TGTGTCAACG ATACCATTAT TCATCTTGCA 
ACACCTTATA TGGGATTTGG TGGTGTTGGT GCTAGTGGTA TGGGAAGTTA TCATGGATTT 
GAAAGTTTTC GCACGTTTAG TCATACTAAG AGCATTGTGA AAAAAGCAAA TTGGCTTGAT 
CTTCCGATGA GATACCATCC ATATACAGAG AAGAATTTGA AAATGATTCG TAAATTCTTA 
AAATAG

Protein sequence

MSEIETGYQK LVTNQREFFR TGKTKQVDFR IQALKKLQSE IKNREAEIME ALKKDLNKSS 
FESYMTEIGM VLDEIRHCIA HVKKWSKPKS VKTPLAQFPS KSFTISEPYG VVLIMSPWNY 
PFQLCIEPLI GAITAGNCAV LKPSAYAAET SKVINTLIRA CFPKEYVTVI EGGRKENQGL 
LATRFDYIFF TGGVEVGKIV MEAAAQFLTP VSLELGGKSP CIIEKSADIN LAAKRVAFGK 
YLNAGQTCVA PDYVFVQKEV EEEFFKKLGL WVHKFFGEEP LKNENLPKII NEHHYHRLLS 
LLEGEDIVIG GKGQDNIRKI EPTVLKSVST DSNIMQEEIF GPILPVLSYK TIEEVIEYVT 
AHEKPLACYL FTTNVQIEKK VLKHVSFGGG CVNDTIIHLA TPYMGFGGVG ASGMGSYHGF 
ESFRTFSHTK SIVKKANWLD LPMRYHPYTE KNLKMIRKFL K