Gene Cwoe_0567 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cwoe_0567
Symbol
ID	8730995
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Conexibacter woesei DSM 14684
Kingdom	Bacteria
Replicon accession	NC_013739
Strand	+
Start bp	597123
End bp	598223
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	70%
IMG OID	646501180
Product	extracellular solute-binding protein family 1
Protein accession	YP_003392377
Protein GI	284042037
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.149111
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGAGAG GCATCAGAGC GGGCGCCGCG ATCGCCGTCG CGGCGCTGCT GGCCGCCGGC 
TGCGGCAGCG GCGGAGGCGG CGAGCTGTCG GTCGCCGACC TGGGCAGCGG CCCGCCGAGA 
GCGGGCACCG TCGAGCCCGG CGCGCTCGAC GGCAAGAAGC TCACGTTCGT CAGCTACGGC 
GGCGACTCGC AGAGAGCGCA GATGGAGGTC CTGAGCGGAT TCGAGCAGGA GTCCGGCGCG 
CAGCTGCTGG AGGACTCGCC GCCCGACTAC GCGAAGATCA AGGCGCAGGT CGAGTCCGAC 
AACGTCACCT GGGACGTCGT CGTCGTGGAC GGGATCTGGG CAGCCGGCCA GTGCGGCAGG 
CTGCTGGAGG ACCTCGACCC GGACGTGATC GACACCTCGC ACCTGCCGAG GGGCGTCGAG 
GCGACGAGGT GCGCGATGCC GGGCAACCTC GACGGCAACG TCTTCGCGTA CGACGCGCAG 
CGCTTCGCGG ACGACCCGCC GAGCTCGTGG GCGGACTTCT TCGACACCGC GAGATACCCG 
GGCAAGCGCG CCGTCGACGC GAGCGACCCG AGCGTCACGC TGGAGATCGC GCTGCTCGCC 
GACGGCGTCA GAGCCGACGA CCTCTATCCG ATCGACGTCG ACCGCGCGCT GCGCAAGCTC 
GACACGATCC GCGACGACCT CGTCTTCTGG AGCTCGGGCG CCCAGCAGCA GCAGATGATG 
ACCTCGCGCC AGATCGCGAT GGGCACGATG TGGTCCGGGC GCGTGTACTT CGCGCTGCAG 
GCGGGCGCGC AGTTCGACGT CGTCCACGAC CAGCCGCTGC TGACGACGAC CACCTGGGTC 
GTGCCGAGGG GCGCCCGCGA CCCGATCGGC TCGATGGCGA TGATCAACTG GTGGCTCGGC 
GCCAGACAGG GCGCGCAGTA CACCGCGCTG ACCTCGTACC CCAGCGTCAA CGCCGACGCG 
AGACCGGTGC TCGACGCCGA CGCGAGAAAG GTCGCGGTGA TGGACCCGCC GTTCACCGAC 
CAGGTCGTCG TCAGCGACGA GTACTGGTCG AGAAACATCG GCAGGCTCAC CGACGTCTGG 
ATCGACTGGG TCAATGGCTA G

Protein sequence

MRRGIRAGAA IAVAALLAAG CGSGGGGELS VADLGSGPPR AGTVEPGALD GKKLTFVSYG 
GDSQRAQMEV LSGFEQESGA QLLEDSPPDY AKIKAQVESD NVTWDVVVVD GIWAAGQCGR 
LLEDLDPDVI DTSHLPRGVE ATRCAMPGNL DGNVFAYDAQ RFADDPPSSW ADFFDTARYP 
GKRAVDASDP SVTLEIALLA DGVRADDLYP IDVDRALRKL DTIRDDLVFW SSGAQQQQMM 
TSRQIAMGTM WSGRVYFALQ AGAQFDVVHD QPLLTTTTWV VPRGARDPIG SMAMINWWLG 
ARQGAQYTAL TSYPSVNADA RPVLDADARK VAVMDPPFTD QVVVSDEYWS RNIGRLTDVW 
IDWVNG