Gene Cwoe_4037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cwoe_4037
Symbol
ID	8734496
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Conexibacter woesei DSM 14684
Kingdom	Bacteria
Replicon accession	NC_013739
Strand	+
Start bp	4286939
End bp	4288666
Gene Length	1728 bp
Protein Length	575 aa
Translation table	11
GC content	74%
IMG OID	646504663
Product	hypothetical protein
Protein accession	YP_003395829
Protein GI	284045489
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGCAC TTGCGATCGA CACCTGGAGC GAGCTGGAGA GACCGGTCCC GCAGTCGGTC 
GCGGTCACCG TCATCGCCCA GGATCCCTCC GTGCAGGTCG CGGGGCGCAT CCTCACCGCA 
CAGATCAGAG TCCCCGCCGA GCACCTCGAC CCCGGGCCGC GCGGCGCGCG CTTCCACGTC 
GTCGACTACG ACGGCGCGAC CGGGAGGCTG CTGCCGCCTG CCGTGCTTGC GCCGACGGTG 
CAGGACCGCT TCGCGGACGC CGGCGACGCC GAGCTGACCG GCGACGCCGA GTTCCGCGCG 
CAGAACGTCT ACGCGATCGC AGCGCGCACG CTCGCCGGCT TCGAGGCCGC GCTCGGGCGG 
CGACTCGGCT GGGGCTTCGA CGGCCACCAG CTGTTCCTCG TCCCGCACGC GATCGCGGAG 
GCGAACGCCT ACTACGCGCC GGAGGACGGC GCGATCTACT TCGGCTACGT CCCACGCGAG 
GACGGCGAGC TGCAGACGGC GCTGTCGCAC GACATCGTCG CGCACGAGAC GACCCACGCG 
ATCCTCGACG GGCTGCGGCC GCTCTATGCG GAGCCCGGCC TGCCCGACCA GCCCGCCTTC 
CACGAGGCGC TCGCCGACGT CGTCGCGCTG CTGTCGCTGT TCTCGATCTC CGGCGTCGCC 
GCACGGCTGC TCGACCCCGA CGGCGACGGC GGCCGGCTGG CGGCCGAGCA GCTGACCGCC 
GAGGCGCTGC GCAGAAGCGC GCTGCTGACG CTCGCCGAGC AGCTCGGCGA CGACGCGAAC 
GACGGCGCCG GCCGCGAGCG CGGCGGCGGG CTGCGCCGCT CGGTCGAGCT GGCGCCGACG 
GCGACGTGGC GCGAGGAGCG CGAGTTCACC GAGCCGCACC GCCGCGCCGA GGTGCTCGTC 
GCCGCGGTCA CGCAGACGCT GCTGCGGATG TGGATGAGCC GCCTGCCGGC GATCCTCTCC 
GAGGACGGCA GCGGCGACCG CGCGCGCGTC GCCGAGGAGG GCGCGACCGC CGCCGCCCAC 
CTGCTGCGGA TGGCGATGCG CAGCGTCGAC TACCTGCCGC CGGTGGAGCT GGAGTACGAG 
GACGTGCTCG ACGCGATCCT GAAGGCCGAC GAGGTCGTCG CGCCCGACGA TGAGCACGGC 
TACCGCGACG CGCTGAGAGC GGCGTTCGCC GCGTTCGGCA TCGAGCGGCC CGTCGGCCGC 
ACGATCGACG TCTCGCGCTC GGGACGGCCG GTCTACGAGC GGATGAACTT CGCGATCCTG 
CGCTCGGACC GCGACGAGGT CTTCCGCTTC CTGTGGGAGA ACGCCGACGT CTTCGAGCTC 
GACCGCGAGT GCGGCTGGCT GCGGGTCGAG TCGATCCGCC CGTCGGTCCG CGTCGGGCCG 
GACGGGCTGG TCGTGCCGGA GGTCGTCGCC AGCTACGTGC AGACGCTGGA GCTGACCGCC 
GGCGAGCTGG CCGAGCGCGG CGCGACCGTG CCGGACGGCC TCCCGCCCGA GACGAAGCTG 
CAGCTGCGCG GCGGCGGGGT CGTCGTCTTC GACCAGTTCG GCCGCGCCAA GCACCACCAG 
CACAAGCGGC TCGACGACTG GGACCGCCAG ACGCGGCGGC TCGCGTACCT CGTCGGGCAC 
GGCCTCGTCG ACTCCAGAGG GCGCTTCGGC TTCACGCTCT CGCAGCCGCG CGGCCAGCGC 
TTCGCCGCGC TGCACGTCTC CGGTGGCGAC GAGGCGGAGC GCTGGTGA

Protein sequence

MPALAIDTWS ELERPVPQSV AVTVIAQDPS VQVAGRILTA QIRVPAEHLD PGPRGARFHV 
VDYDGATGRL LPPAVLAPTV QDRFADAGDA ELTGDAEFRA QNVYAIAART LAGFEAALGR 
RLGWGFDGHQ LFLVPHAIAE ANAYYAPEDG AIYFGYVPRE DGELQTALSH DIVAHETTHA 
ILDGLRPLYA EPGLPDQPAF HEALADVVAL LSLFSISGVA ARLLDPDGDG GRLAAEQLTA 
EALRRSALLT LAEQLGDDAN DGAGRERGGG LRRSVELAPT ATWREEREFT EPHRRAEVLV 
AAVTQTLLRM WMSRLPAILS EDGSGDRARV AEEGATAAAH LLRMAMRSVD YLPPVELEYE 
DVLDAILKAD EVVAPDDEHG YRDALRAAFA AFGIERPVGR TIDVSRSGRP VYERMNFAIL 
RSDRDEVFRF LWENADVFEL DRECGWLRVE SIRPSVRVGP DGLVVPEVVA SYVQTLELTA 
GELAERGATV PDGLPPETKL QLRGGGVVVF DQFGRAKHHQ HKRLDDWDRQ TRRLAYLVGH 
GLVDSRGRFG FTLSQPRGQR FAALHVSGGD EAERW