Gene Cwoe_3408 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cwoe_3408
Symbol
ID	8733857
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Conexibacter woesei DSM 14684
Kingdom	Bacteria
Replicon accession	NC_013739
Strand	+
Start bp	3632607
End bp	3633644
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	70%
IMG OID	646504025
Product	aldo/keto reductase
Protein accession	YP_003395201
Protein GI	284044861
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.299651
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCTCCT CCTACACCGC TGCCGCGGAC CGCTACGAGA CGACGATGCA ATACCGCCGC 
TGCGGGCGCA GCGGCCTGCT GCTGCCGGCG ATCTCGCTCG GCCTCTGGCA CAACTTCGGC 
GACGACCGGC CGCTGGAGAA CCAGCGCGCG ATCCTGCGCC GCGCGTTCGA CCTCGGCGTC 
ACGCACTTCG ACCTCGCGAA CAACTACGGG CCGCCGTACG GCTCCGCCGA GACGAACTTC 
GGCCACATCA TGCGCGAGGA CCTGCGGCCC TACCGCGACG AGCTGATCGT CTCGACGAAG 
GCCGGCTGGG ACATGTGGCC CGGGCCGTAC GGCGAGTTCG GCTCGCGCAA GTACCTGCTC 
GCCTCGCTCG ACCAGTCGCT GAAGCGGATG GGGCTCGACT ACGTCGACAT CTTCTACTCC 
CACCGCTTCG ACCCGGACAC GCCGCTGGAG GAGACGATGG GCGCGCTCCA CACAGCCGTC 
CAGCAGGGCA AGGCGCTCTA CGTCGGGATC TCCTCCTACG GCTCGCCGCG CACCGCCGAG 
GCGATCGGGA TCCTGCGCGA CCTCGGCACG CCGCTGCTGA TCCACCAGCC GTCGTACTCG 
CTGCTGAACC GCTGGATCGA GAGAGGCCTG CTCGACGTGA TCGGCGAGCA CGGCGTCGGC 
TCGATCGTCT TCACGCCGCT GGCGCAGGGG ATGCTGACCG ACCGCTACCT CGACGGCATC 
CCGTCCGACT CGCGCGCGGC GAGAAGAACC TCGCTCGACC CCGGCTGGCT GGACGAGAGA 
ACGCTCGCGC ACATCCGCGC GCTGAACGAG ATCGCGCAGC GGCGCGGCCA GTCGCTGGCG 
CAGATGGCGC TCGCCTGGAC GCTGCGCGAC CCGCGCGTGA CCTCGACGCT CGTCGGCGCC 
AGCAGCGTCG CGCAGCTCGA GGACAACCTC GGGGCGCTCG ACAACCTGTC CTTCTCCGAC 
GAGGAGCTGC AGGAGATCGA GGACCGCACG ACCGAGGCGG GGATCAACCT CTGGGCCGAG 
TCGGCCGAGG TCGACTGA

Protein sequence

MASSYTAAAD RYETTMQYRR CGRSGLLLPA ISLGLWHNFG DDRPLENQRA ILRRAFDLGV 
THFDLANNYG PPYGSAETNF GHIMREDLRP YRDELIVSTK AGWDMWPGPY GEFGSRKYLL 
ASLDQSLKRM GLDYVDIFYS HRFDPDTPLE ETMGALHTAV QQGKALYVGI SSYGSPRTAE 
AIGILRDLGT PLLIHQPSYS LLNRWIERGL LDVIGEHGVG SIVFTPLAQG MLTDRYLDGI 
PSDSRAARRT SLDPGWLDER TLAHIRALNE IAQRRGQSLA QMALAWTLRD PRVTSTLVGA 
SSVAQLEDNL GALDNLSFSD EELQEIEDRT TEAGINLWAE SAEVD