Gene Cwoe_2249 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cwoe_2249
Symbol
ID	8732692
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Conexibacter woesei DSM 14684
Kingdom	Bacteria
Replicon accession	NC_013739
Strand	+
Start bp	2369973
End bp	2371562
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	72%
IMG OID	646502867
Product	Aldehyde Dehydrogenase
Protein accession	YP_003394049
Protein GI	284043709
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.408136
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.876589
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACCTT CCGCCACCCA GACCCTCGAG GTCGCCAGCA TCGTCGCCGG CCGCGCGGTC 
GACGGCGCCG CCGGCGGGAC GCTCGCGACC CGCAACCCGG CCGACCTGAC GCAGGTCGTC 
GCGAACGTGC GGCTCGCCGA CAGCGCCGCG TTCGTGGCAG CGGCGCGCGC CGCGCACGAC 
GCGCAGCCCG CGTGGGCTGC GGTGCCGGCA CCCGTGCGCG GCGCGGTCGT GCAGCAGATC 
GGCCGTCTGG TCGAGGCGAG CAAGGAGTCG CTGGCGCGGC TGATCACGAC CGAGATCGGC 
AAGCCGTACG CCGAGGCGCT CGGCGAGGTG CAGGAGGTCG TCGACACCTG CAACTTCTTC 
ATCTCCGAGG GACGCCGGCT CTACGGCCAG ACCGTCCCGT CGGAGATGCC CGACAAGCAG 
CTGTTCACGT TCCGCAAGCC GGTCGGCACG TGCGCGATCG TCACCGCCGG CAACTTCCCG 
GCGGCGGTGC CGTCGTGGTA CATCGTGCCG GCGCTGCTGT GCGGCAACAC GGTCGTGTGG 
AAGCCGGCCG AGTACGCGGC CGGCGTCAGC CGTGCCTTCT ACGAGCTGTT CGCGCGCGGC 
GGGCTGCCGG ACGGCACGCT CAACCTCGTG CTCGCCGACG GCCCCGCGAC GTTCGCCGGG 
CTGGAGCAGT CGCTGGAGCT GGGGCTCGTC GACAAGGTCG GCTTCACGGG CTCCTCCGAG 
GTCGGCGTCC AGATCGGCGA GCTGTGCGGG CGCAACCTGC AGACGCCGTG CCTGGAGCTG 
GGCGGCAAGA ACCCGCTCGT CGTGATGGGC GACGCCGACC TGGAGCTGGC GGTCGAGGGC 
GCGCTGTTCT CCGGCTTCGG CACGGCCGGA CAGCGCTGCA CGTCGCTCGG CGTCGCGATC 
GTCCACGACT CGGTCTACGA CGAGTTCCTG GAGCGCTTCG ACGCAGCCGC GCGCGCCGCG 
GTCGCCGGCG ACCCGGCGGG CGACGTGCTG TTCGGGCCGC TGATGAACGA GCGCTTCGCG 
GAGCGCTTCG AGCAGTGGCT CGGGCTGATC CAGCCGCACC ACCGCGTGCT CGGCTCCAGC 
GGCACCGGCC GCATCACGGC CGCGAACCCG CGCGCGGGCT TCAGCGGCGG CGACCCCGAG 
CGGGGCGTCT TCTACCACCC GACGATCGTC GCCGACGTGA CCACCGACGA CGAGCTGTAC 
CGGCGCGAGA CGTTCGGCCC GATCGTCGCC GTCGCGCGCT TCTCGACCTT CGACGAGGCG 
ATCGCGCTCG CGAACGGCCA CGGCTACGGG CTGTCGTCGG CGATCTACAC GCGCGACGCG 
ACGGCGGCGC TGCGCTTCCG CGAGCGCGTC AGCGCGGGCA TGGTGTCGGT CAACAACTCG 
ACGAGCGGCG CCGAGGCGCA CCTGCCGTTC GGCGGCAACG GCAAGTCCGG CAACGGCTCG 
CGCCAGTCCG GCGTCTGGGT GCTCGACCAG TTCACGCGCT GGCAGTCGGT CAACTGGGAC 
TTCTCCGGCA AGCTTCAGAA GGCGCAGATG GACGTCGTCG AGATCACCGC CGACGAGGGC 
TTCCGGCTGG ACGGGTGGGA CGGACGCTGA

Protein sequence

MSPSATQTLE VASIVAGRAV DGAAGGTLAT RNPADLTQVV ANVRLADSAA FVAAARAAHD 
AQPAWAAVPA PVRGAVVQQI GRLVEASKES LARLITTEIG KPYAEALGEV QEVVDTCNFF 
ISEGRRLYGQ TVPSEMPDKQ LFTFRKPVGT CAIVTAGNFP AAVPSWYIVP ALLCGNTVVW 
KPAEYAAGVS RAFYELFARG GLPDGTLNLV LADGPATFAG LEQSLELGLV DKVGFTGSSE 
VGVQIGELCG RNLQTPCLEL GGKNPLVVMG DADLELAVEG ALFSGFGTAG QRCTSLGVAI 
VHDSVYDEFL ERFDAAARAA VAGDPAGDVL FGPLMNERFA ERFEQWLGLI QPHHRVLGSS 
GTGRITAANP RAGFSGGDPE RGVFYHPTIV ADVTTDDELY RRETFGPIVA VARFSTFDEA 
IALANGHGYG LSSAIYTRDA TAALRFRERV SAGMVSVNNS TSGAEAHLPF GGNGKSGNGS 
RQSGVWVLDQ FTRWQSVNWD FSGKLQKAQM DVVEITADEG FRLDGWDGR