Gene Cwoe_0171 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cwoe_0171
Symbol
ID	8730599
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Conexibacter woesei DSM 14684
Kingdom	Bacteria
Replicon accession	NC_013739
Strand	+
Start bp	168198
End bp	169604
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	67%
IMG OID	646500785
Product	extracellular solute-binding protein family 1
Protein accession	YP_003391982
Protein GI	284041642
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACGACC ATCAGGACGC CGACGCGCGT GAGCGCGCCG ACGCCGAACA GGGCTTGAAG 
GTCTCGCGCG CCACGCTGCT GCGCGGTGCT GCGGCCGCCG GCATCGCGCT GCCGGCGATG 
GGCCTGCTCT CCGCCTGCGG GAGCGGCGAC GACGACAGCT CGGCCAGCAC GAGCGGCGAC 
TCCGGCGGCA CCTCCGAGGC GTACACCGGC GCGCTCGCGA TGACCGCGTG GGAGGCGTAT 
CCGGACCAGA TCAGAGAGAA CCTGGCCGCG TTCAAGCAGC AGTACGGCAA CCAGGTCGAC 
CTCACACTGA TCCCCAACAT CGGCTACGGG CCCGCGATCC AGACGCGCCT GCAAGGCGGC 
CAGGAGATCG ACGCCTACTA CAACTTCGCG TACAACTCGA CGAAGTTCGT CGACGCCGGC 
TGGGCGAAGG AGCTGAACGA CCTCCCGGGC GTCGAGGAGA TGCTCGCGGA CATGTTCGAG 
ACCTCCGCCG CGCGGCACAA GCTGCCCGAC GGCCGCATCG TCTCGGTCCC GTACTTCTCC 
GCCGTGCACC TCCTGATGTA CAACGAGGCG CAGCTGAGAG AGAACGGCAT CTCCGCCGCG 
CCGCAGTCGT ACAGCGAGAT CTACGACCAG TGCGAGAAGC TCAAGGCCGG CGGCGTCCGC 
GCCCCCTACG CCGCCTACTG GACCAAGCAG TTCTCGGAGG AGTACTTCAT CCTCTACCTC 
GTCTCCGAGG GCATCGTCCC GTTCGACGAC GACGGCAACC CGACGTTCCA GGACGACCCC 
AAGACCGAGG GCGTCCTCGA CTGGTGGACG TCGATGTACC AGGACGGCCT CACCGCCAGA 
TCGATCCTCA CCGACGATCC CGGCAAGCAC GTCGCGGCGA TGGCGCAGGG CACCTCCAGC 
TTCTTCACCC TGCACCACTA CTTCCTCAAG GAGATCCGCA ACGCCAGAGG ACCGCAGTCG 
AGAAACGTCA CGATGAGCTA CCGGATCCCC GGCAGCTCGG GCGAGAGCCT CCAGATCGGC 
GAGGTCGTCC AGATGGGCAC CAAGGCCGAC GGCGGTCGTG CCGACAGAGC GTGGGAGCTG 
CTCAAGTTCT ACGGCTGGAA GGACAAGGAC GGCCGCTACG GCACGTTCAT ATCGTGGGCC 
GAGTCGGCCG CGCTGCTCGG GCCCTACCCC GGCCTCTTCA AGGACCCGCA GTTCAGAAGA 
GCGTTCCCCG CCTACTACGA CCTCGGCGAG CTGGAGAGAG CGTTCGAGGC CTCGCAGGTC 
GTCCCCGCCC GCGTGCTGCC GTGGTACTCG TCCTTCCAGA CGAAGGTCGG CGACCGCATC 
CAGGCGATGC TGCTCGGCCA GGCGAGCGTG AAGGACACGA TCTCGTCGCT CGCCGACGAC 
GCGAAGAGCT TTGCCGCCGC AGGCTGA

Protein sequence

MHDHQDADAR ERADAEQGLK VSRATLLRGA AAAGIALPAM GLLSACGSGD DDSSASTSGD 
SGGTSEAYTG ALAMTAWEAY PDQIRENLAA FKQQYGNQVD LTLIPNIGYG PAIQTRLQGG 
QEIDAYYNFA YNSTKFVDAG WAKELNDLPG VEEMLADMFE TSAARHKLPD GRIVSVPYFS 
AVHLLMYNEA QLRENGISAA PQSYSEIYDQ CEKLKAGGVR APYAAYWTKQ FSEEYFILYL 
VSEGIVPFDD DGNPTFQDDP KTEGVLDWWT SMYQDGLTAR SILTDDPGKH VAAMAQGTSS 
FFTLHHYFLK EIRNARGPQS RNVTMSYRIP GSSGESLQIG EVVQMGTKAD GGRADRAWEL 
LKFYGWKDKD GRYGTFISWA ESAALLGPYP GLFKDPQFRR AFPAYYDLGE LERAFEASQV 
VPARVLPWYS SFQTKVGDRI QAMLLGQASV KDTISSLADD AKSFAAAG