Gene Cwoe_3349 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cwoe_3349
Symbol
ID	8733798
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Conexibacter woesei DSM 14684
Kingdom	Bacteria
Replicon accession	NC_013739
Strand	+
Start bp	3562835
End bp	3564514
Gene Length	1680 bp
Protein Length	559 aa
Translation table	11
GC content	70%
IMG OID	646503966
Product	extracellular solute-binding protein family 5
Protein accession	YP_003395142
Protein GI	284044802
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.109598
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0359992
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGAGA TCGTGCGCGC CGAGATGACC CGGCGCGAGG CGCTGCGGCG CCTCGGCGTC 
GGCGGCGCCG TGCTGACGCT GCCCGCGCTG CTGGCCGCGT GCGGCTCCGG CGGCTCCGGC 
TCGACGTCGG CGTCGGGCGG GACGAGAGCG AGCGGCAGCG TCGCCGGCGC AGGCACCGAC 
GCGGAGATCG ACCACGTCAC GTGGTCGCTC GGTGGCACCC CGCCGACGCT CGACATCGCG 
ACCGGCAACC TCACCGTCGG CGAGATGGTG ATGGCGCTCG GGATGGAGAC GCTGATGGGC 
CTCGACGACA GACTGCGGCT CAAGCCGGTG CTGGCCGAGT CCTCCGAGGA GCCCGACCCG 
CGCACCTACG TCTACAGACT GCGCGAGGGC GTCAGATTCT GGGACGGCTC GCCGCTGACG 
GTCGACGACG TCGTCTGGTC GCTGCGGCGG CACATGGACC CGAAGGTCAG CTCGCAGATC 
TCGACGTACT TCACCCATGT GCGCTCGATA GAGGCGACCG GGCCGCGCGA GGTGACGGTG 
CGGATGAAGC AGCCGGACCC GCTGTTCCCG TACGCCCACG TCCACATCTT CATCATGCCG 
AAGGCGTTCG GCGAGAGACT TGGCAAGAAG CTCGGCGCGC CGGCCGCGAC CGTCAGCGTG 
ATGGGAACCG GGCCGTACAG AATCACGTCG TTCACCGGTG ACAACGAGAT CGTCGTCGAG 
CGCAACGACG ACTACTGGGG TGAGCGCCAG CGCGTGCGCA GAGCGTCACT GAAGTTCATC 
GGCGACCCGC GCACGAACCT GCTCGCGATG CGCTCCGGCG AGATCGACGG GATGTTCGAG 
TTCGCGATCA GCACGGCGAG AGAGTGGGAC CGGCTGCCGG ATGCGAGAAC CGAGTGGGCG 
CCGGGGATGA GCGTCGTGCT GCTCTCGTTC GACCTCTCGC AGGCGCCGTG GAACGACGTC 
CACGTGCGCA GAGCGGTCGC TCATGCGGCC GACCGCGCCG GCTACGTGCG CGCGTTCCTC 
GGCGGGCACG GCGAGCCGGC GACGACGATC CCCGCGCCGC TCCAGTGGGG CGACGTGGCG 
ACGCCGGACG AGGTCAGAGC GATCTACGCG AGGCTGCCCG CCTACGCGTA CGACCTCGAG 
GCCGCGAAGG CCGAGCTGGC GAAGTCCCAG CACCCGGACG GCTTCACCGC CGACGTCGTG 
TTCCCCAACT CGGCCGCCCC GGCCGGCCGC GCGCTCGTGA GCCTGTCCGA GACGCTCAAG 
CAGCTCGGCA TCACGCTCAA CGTCCGCGAG GTGCCGCAGA ACACGTGGCT GGCGAAGCTG 
TACGCGCACA AGGACCTTGG GCTCCAGTAC CTGCGGCTGT CGCCCGACTA CGTCGACCCG 
TCGAACTTCC CGGGCGCGCT GCTGCCGAGC GCGAACGCGG TCCCGAACAA CTTCAACCTC 
GCGAACTTCA GAGACCCCGA GGTCGACCGC CTGCTCGCGC AGCAGAGCAG GACGACCGAC 
GCCGCGGCGC GAACGCAGGC GCTGACGCGG GTGCTGCAGA TAGCCGGCGA GCAGCTGCCC 
TATCTGCCGC TGTGGTGGGA GAGCGTGCCG ATGGGTCTCG CCGACAGATT CGTCTACGAG 
GGCTTCAACC CGATCTACTA CGCGGAGAAC TGGCTCGGCA AGCTGCGCGT GCGCGCATGA

Protein sequence

MNEIVRAEMT RREALRRLGV GGAVLTLPAL LAACGSGGSG STSASGGTRA SGSVAGAGTD 
AEIDHVTWSL GGTPPTLDIA TGNLTVGEMV MALGMETLMG LDDRLRLKPV LAESSEEPDP 
RTYVYRLREG VRFWDGSPLT VDDVVWSLRR HMDPKVSSQI STYFTHVRSI EATGPREVTV 
RMKQPDPLFP YAHVHIFIMP KAFGERLGKK LGAPAATVSV MGTGPYRITS FTGDNEIVVE 
RNDDYWGERQ RVRRASLKFI GDPRTNLLAM RSGEIDGMFE FAISTAREWD RLPDARTEWA 
PGMSVVLLSF DLSQAPWNDV HVRRAVAHAA DRAGYVRAFL GGHGEPATTI PAPLQWGDVA 
TPDEVRAIYA RLPAYAYDLE AAKAELAKSQ HPDGFTADVV FPNSAAPAGR ALVSLSETLK 
QLGITLNVRE VPQNTWLAKL YAHKDLGLQY LRLSPDYVDP SNFPGALLPS ANAVPNNFNL 
ANFRDPEVDR LLAQQSRTTD AAARTQALTR VLQIAGEQLP YLPLWWESVP MGLADRFVYE 
GFNPIYYAEN WLGKLRVRA