Gene Cwoe_2920 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cwoe_2920
Symbol
ID	8733365
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Conexibacter woesei DSM 14684
Kingdom	Bacteria
Replicon accession	NC_013739
Strand	-
Start bp	3117977
End bp	3119197
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	70%
IMG OID	646503534
Product	formaldehyde dehydrogenase, glutathione- independent
Protein accession	YP_003394714
Protein GI	284044374
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR02819] formaldehyde dehydrogenase, glutathione-independent

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.754967
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.420653
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGACA CCAACAGAGG CGTCGTCTAC ATGGGTCCCG GCACGGTCGA GGTCCAGACG 
ACCGACTACC CGAGCTTCGT GCTCAGAGAC GGCCCCGGAG TCCATCCAGA CAGCGTCGGG 
CGCGAGTGCA ACCACGGCGT GATCCTGCGG ATCGTCTCGA CCAACATCTG CGGCAGCGAC 
CAGCACATGG TGCGCGGCCG CACGACGGCG CCCGAGGGGC TGATCCTCGG GCACGAGATC 
ACCGGCGAGG TGATCGAGAG AGGCCGCGAC GTCGAGTACA TCGACGAGGG CGACCTCGTA 
TCCGTCCCGT TCAACATCGC CTGCGGGCGC TGCCGCAACT GCAAGGAGCG CAAGACCGGC 
ATCTGCCTCA ACACCAACCC GGCGCGGCCG GGGGCAGCGT ACGGCTACGT CGACATGGGC 
GGCTGGCCCG GCGGGCAGGC GCGCTACGTG ATGGTCCCCT ATGCCGACTT CAACTGCCTC 
AAGTTCCGTG ACAAGGAGCA GGCGCTGGCG AAGATCCTCG ACCTCACGAT GCTGTCGGAC 
ATCTTCCCGA CGGGGTACCA CGGCTGCGTC ACGGCGGGCG TGACGACCGG CAGCACGGTC 
TACATCGCGG GCGGCGGCCC GGTCGGGTTG GCGGCGGCGC ACGGCGCGCA GCTGCTCGGT 
GCCGCGGTCG TGATCGTCGG CGACCTGATC CCGGAGCGGC TGGCGCAGGC GAAGAGCTTC 
GGCTGCGAGA CGATCGACGT CTCCAGAGGA GACCCCGGCG AGCAGATCGA GCAGCTGCTC 
GGCGTGCCGG AGGTCGACTG CGGCGTCGAC GCCGTCGGCT TCGAGGCGCG CGGCCACGGC 
GAGCACGCGA GCGAGGAGCT GCCCGCGACG GTGCTGAACT CGCTGATGGG ACTGACGCGC 
GCGGGCGGCG CGCTCGGCAT CCCGGGCCTC TACGTGACCG GCGACCCGGG CGCGCACACG 
GACGCGGCGA AGGAGGGCTC GCTGTCGATC CGGATCGGGC TCGGCTGGGC GAAGTCGCAC 
GTCTTCACGA CCGGCCAGTG CCCGGTGATG AGATACAACC GCGAGCTGAT GGAGGCGATC 
CTCGGCGACC GCTGCCAGAT CGCCAGAGCG GTCAACGCGA CGGTGATCAC GCTCGACGAC 
GCGCCGCAGG GCTACAGAGA CTTCGACAGA GGAGCGGCGA AGAAGTTCGT CCTCGACCCG 
AACGGGCTGA TCCCGGCCTA G

Protein sequence

MADTNRGVVY MGPGTVEVQT TDYPSFVLRD GPGVHPDSVG RECNHGVILR IVSTNICGSD 
QHMVRGRTTA PEGLILGHEI TGEVIERGRD VEYIDEGDLV SVPFNIACGR CRNCKERKTG 
ICLNTNPARP GAAYGYVDMG GWPGGQARYV MVPYADFNCL KFRDKEQALA KILDLTMLSD 
IFPTGYHGCV TAGVTTGSTV YIAGGGPVGL AAAHGAQLLG AAVVIVGDLI PERLAQAKSF 
GCETIDVSRG DPGEQIEQLL GVPEVDCGVD AVGFEARGHG EHASEELPAT VLNSLMGLTR 
AGGALGIPGL YVTGDPGAHT DAAKEGSLSI RIGLGWAKSH VFTTGQCPVM RYNRELMEAI 
LGDRCQIARA VNATVITLDD APQGYRDFDR GAAKKFVLDP NGLIPA