Gene Cwoe_4236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cwoe_4236
Symbol
ID	8734698
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Conexibacter woesei DSM 14684
Kingdom	Bacteria
Replicon accession	NC_013739
Strand	-
Start bp	4496528
End bp	4498036
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	72%
IMG OID	646504862
Product	methylmalonate-semialdehyde dehydrogenase
Protein accession	YP_003396025
Protein GI	284045685
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01722] methylmalonic acid semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.987331
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.292037
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCAA CGAGCACCAC CACCCTCAAC CACTGGATCG GCGGCCGTGA GGACGCCGGC 
ACCGGCGACC GCTTCGGCGA GGTGACGGAG TCGGCGACCG GCGAGCTCGT CGCGCGCGTC 
GCGTTCGCGA CCGAGGCCGA CGTCGACCGC GCCGTACGCG TCGCGGCCGA GGCCGCCGAC 
GCGTGGGGCA GATCCTCGCT CGGCCAGCGC ACGAAGGTGA TGTTCGCCTT CCGCGAGCAG 
GTCAACTCGC GCCGCGACGA GCTTGCTCGC GCGATCACGC GCGAGCACGG CAAGGTCCTC 
TCCGACGCCG CCGGCGAGGT CCAGCGCGGC ATGGAGGTGA TCGACTTCGC GTGCGGTCTC 
GGCCACCTGC TGAAGGGCGA GATGTCCGGC CAGGTCTCGC GCGGCGTCGA CTCGTACTCG 
CTGCGTCAGC CGCTCGGCGT CGTCGCCGGC ATAACGCCGT TCAACTTCCC CGTGATGGTG 
CCGCTGTGGA TGGCGCCGGT CGCGCTCGCG GCCGGCAACG CGTTCGTGCT GAAGCCGTCC 
GAGCAGGACC CGTCCGCCTC GCTGCTGCTC GCCGACATGC TGAAGAACGC CGGTCTGCCC 
GAGGGCGTCT TCACGGTCAT CAACGGCGAC AAGGACGCGG TCAACGCGCT GCTCGTCCAC 
CCCGAGGTGA GAGCGGTCTC GTTCGTCGGC TCGACGCCGA TCGCCAAGCA CGTCTACGAG 
ACGGCGACGG CGCACGGCAA ACGCGTGCAG GCGCTCGGCG GCGCGAAGAA CCACGCCGTC 
GTGCTGCCCG ACGCCGACCT CGACCTCGCC GCCGACGCGC TCGTCTCGGC CGGCTACGGC 
TCCGCCGGCC AGCGCTGCAT GGCGGTCTCC GTCGCGGTCG CCGTCGGCGC GATCGCCGAG 
CCGCTGATCG CGAAGATCCA GGAGCGGATC GCCGGCCTGA CCGTCGGCGA CGGCTTCGAC 
GCGGCGTCCG AGATGGGCCC GCTCGTGAGC GAGCGCCACC TCGGCCGCGT GCGCGGCCTC 
GTCGACTCCG GCGAGGGCGA CGGCGCGACG CTGCTGGCCG ACGGCCGCGC GATCGCGGTC 
GAGGGCCGCG AGGGCGGCCA CTGGCTCGGC CCGACGCTGT TCGACAACGT CAGACCCGGC 
ATGGCGATCT ACGACGAGGA GATCTTCGGC CCGGTGCTGT GCGTCGTGCG CGCGGACTCC 
TACGACGAGG CCGTCGGCCT CGCGAACTCC AGCCCGTACG GCAACGGCGC GGCGATCTTC 
ACCAACGACG GCGGCGCCGC CCGGCAGTTC GAGCAGGACA TCACGGCCGG CATGGTCGGC 
GTCAACGTGC CGATCCCGGT GCCGATGGCC TACCACTCGT TCGGCGGCTG GAAGGACTCG 
CTGTTCGGCG ACCTCCACGT CCACGGCCCC GACGGCGTGC GCTTCTACAC GCGCGGCAAG 
GTGATCACGC GCCGCTGGCC CGACCCGGCC GACCGCGGCA TCGACCTCGG CTTCCCGGTC 
CACTCGTAG

Protein sequence

MTATSTTTLN HWIGGREDAG TGDRFGEVTE SATGELVARV AFATEADVDR AVRVAAEAAD 
AWGRSSLGQR TKVMFAFREQ VNSRRDELAR AITREHGKVL SDAAGEVQRG MEVIDFACGL 
GHLLKGEMSG QVSRGVDSYS LRQPLGVVAG ITPFNFPVMV PLWMAPVALA AGNAFVLKPS 
EQDPSASLLL ADMLKNAGLP EGVFTVINGD KDAVNALLVH PEVRAVSFVG STPIAKHVYE 
TATAHGKRVQ ALGGAKNHAV VLPDADLDLA ADALVSAGYG SAGQRCMAVS VAVAVGAIAE 
PLIAKIQERI AGLTVGDGFD AASEMGPLVS ERHLGRVRGL VDSGEGDGAT LLADGRAIAV 
EGREGGHWLG PTLFDNVRPG MAIYDEEIFG PVLCVVRADS YDEAVGLANS SPYGNGAAIF 
TNDGGAARQF EQDITAGMVG VNVPIPVPMA YHSFGGWKDS LFGDLHVHGP DGVRFYTRGK 
VITRRWPDPA DRGIDLGFPV HS