Gene Cwoe_5889 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cwoe_5889
Symbol
ID	8736365
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Conexibacter woesei DSM 14684
Kingdom	Bacteria
Replicon accession	NC_013739
Strand	-
Start bp	6300656
End bp	6302443
Gene Length	1788 bp
Protein Length	595 aa
Translation table	11
GC content	69%
IMG OID	646506515
Product	extracellular solute-binding protein family 5
Protein accession	YP_003397664
Protein GI	284047324
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCGAC TCGTCGTGCG GACGCTCATC GCGAGCCTCC TCTGCATGAC CCTCGCCTCG 
ACGATCGCCG CGTGCGGGTC CGGCGACGAC GACGGTGGCG GCGGGAACGC CCGCACGACC 
GCGAGAGCGG ACAGCGGCGC CGGCGGCAGA AGAGGGGGGA CGCTGAGAGT CCTCACCGAG 
GAGGACGTCA GCGGGCTCGA CCCGGGCGTG ACCTACTCGA GCGCCGCGTT CAACCTGCTC 
TCCGGGACGG TCCGCCCGCT CTACCGTTAC GCGCCCGAGA ACCCGACCGA CATCGAGCCC 
GACCTCGCCG CCTCCCAGCC GCAGATCTCG GCGGACGGCA GAACCGTCAC GGTGAGAATC 
CGCAGAGGGG TGAGATTCGG CCCGCCGGTG AACCGGGAGG TGACGTCGAG AGACGTCAAG 
TACGCGATCG AGCGCGGCTT CAATCCGAGC GTCGGCAACC CCTACGCGCC GACGTACTAC 
GGCGACCTCG TCGGCGTCGA CAGAGCTGAC GGCGGCCCGA TCGCCGGGAT CGAGACGCCC 
GACGAGCAGA CGATCGTCTT CCGCCTCACG AGACCGACAG GCGGCGTCCT CGCGCAGGCG 
ACGACGCTGC CGCTGTCGGC TCCCGTGCCG CAGGAGTACG CGAGCAGATT CGACGACAAG 
CCGGAGGGCG AGCTGACCGA CTACGGCAAC TGGCAGATCT CGTCGGGGCC GTACATGTTC 
GCCGCCGACG CGAACGGCAG AGCGCTCGGC AACGGGATCG TGCCCGGTCG CAGACTCGAG 
CTCGTGCGCA ACCCGAACTG GGACGCCGCG ACCGACGGGC GGCCCGCCTA CCTCGACGGC 
ATCGACTGGT CGGTCGGCAA CGAGCCGAAC GTCGCCGGCC GGCAGGTGCT CGACGGCAGC 
GGCCTGACGC TCGGCGACAC GCCGACCGCC GAGACGGTCA AGCGCGCGGT CCAGCGCTAC 
CCGGAGCAGA TCTTCTTCAG CCCCGGCGCC GGCAACCGCT ACGCCGCGCT CAACACCGCG 
ATCCCGCCGT TCGACGATCC CGACCTGCGC AAGGCGGTCG CCGCGCAGCT CGACCGCGAG 
CAGATGCGGC TCGTCCGCGG CGGCGCCTCG ATCGGCGACA TAGCGACGCA CCTCCTCTAC 
CCCGGCGTCG CCGGCTTCGA GGAGGCCGGC GGGATGAGAG GCCCGGAGCT CGACTTCCTC 
GCGAACCCCG CCGGCGACCC GGCGATCGCG AGAAAGTACA TGGCGGCGGC CGGCTACCCC 
GACGGCAGAT ACACCGGCAG AGAGACGGTC GAGGTCGTCG GCGTCTCCGG CGACCCGGCC 
GACAAGGACT CGCAGCTGGT CGACGAGGCG CTCAGACAGC TCGGCTTCAG AACGAAGCTG 
CGGCTCGTCG ACTCGGACAC GATGTACGGC AGATTCTGCG CGTCGCCGAA GGCGAGAGCC 
GAGGTCTGCC CGATCCTCGG GTGGATACGC GACTTCGCCG ATCCGCAGAC GGTGCTCGAC 
GCCGCCTTCA ACGGCACGAC GATCTCGCAG GAGGACGGCA CCAACTCGAA CTGGCCGCAG 
CTGAACGATC CGAGAATCAA TGCGGCGATG GCGAGAGCGG AGTTGGTCGT CGACAAGCAG 
GAACGTGCCG AGGCGTGGGC GAACATCGAT CGCATGATCA CCGAGACCGG TGCCGCGATC 
CCATGGCTGT GGGACAAGCA GCCGGTCATC TCCTCAAAGG ACGTCCGCTG CGCCAACCAG 
CTGTGGAACC AGGGGCACTG CGACTTCGCC TACAGCTCCC TGAGATAG

Protein sequence

MPRLVVRTLI ASLLCMTLAS TIAACGSGDD DGGGGNARTT ARADSGAGGR RGGTLRVLTE 
EDVSGLDPGV TYSSAAFNLL SGTVRPLYRY APENPTDIEP DLAASQPQIS ADGRTVTVRI 
RRGVRFGPPV NREVTSRDVK YAIERGFNPS VGNPYAPTYY GDLVGVDRAD GGPIAGIETP 
DEQTIVFRLT RPTGGVLAQA TTLPLSAPVP QEYASRFDDK PEGELTDYGN WQISSGPYMF 
AADANGRALG NGIVPGRRLE LVRNPNWDAA TDGRPAYLDG IDWSVGNEPN VAGRQVLDGS 
GLTLGDTPTA ETVKRAVQRY PEQIFFSPGA GNRYAALNTA IPPFDDPDLR KAVAAQLDRE 
QMRLVRGGAS IGDIATHLLY PGVAGFEEAG GMRGPELDFL ANPAGDPAIA RKYMAAAGYP 
DGRYTGRETV EVVGVSGDPA DKDSQLVDEA LRQLGFRTKL RLVDSDTMYG RFCASPKARA 
EVCPILGWIR DFADPQTVLD AAFNGTTISQ EDGTNSNWPQ LNDPRINAAM ARAELVVDKQ 
ERAEAWANID RMITETGAAI PWLWDKQPVI SSKDVRCANQ LWNQGHCDFA YSSLR