Gene Cwoe_5639 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cwoe_5639
Symbol
ID	8736115
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Conexibacter woesei DSM 14684
Kingdom	Bacteria
Replicon accession	NC_013739
Strand	+
Start bp	6039775
End bp	6040884
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	69%
IMG OID	646506269
Product	putative sugar ABC transporter, substrate- binding protein
Protein accession	YP_003397418
Protein GI	284047078
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4213] ABC-type xylose transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.420367
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGATCA TCCGCACGGG GACCGCGGTT GTGCTCGCCG GGGCGCTCGC CCTCGGTGCC 
AGCGCCTGCG GCAGCGACGA CGACGGGGGC GGCTCGACGA CCGCCGCAAG CAGCGGCGGG 
GGCGGCGGGG GCGAGAAGAT CGCGCTGCTG CTGCCCGAGT CCAAGACGGC GCGCTACGAG 
AATCAGGATC GACCGCGCTT CGTCGAGAAG GTCAGAGAGC TGTGCCCAGA CTGCGAGGTG 
CTCTACTCGA ACGCCGAGCA GGACCCCGCC CAGCAGCAGC AACAGGCCGA GCAGGCGATC 
ACCAACGGCG CGAGAGTGCT CGTCGTCGAC GCCGTCGACG TGAAGTCGGC CGCGGCGATC 
GCGACGAACG CGAAGTCCCA GGGCGTGCCG GTCGTCAGCT ACGCGCGCCT GATCTCCGAC 
GCCGAGCTCG ACGCGTACGT CTCGATCGAC CCGTTCAGAG TCGGCCAGCA GCAGGGCGAG 
GCGCTCGTGA GAGCGCTCAG AGGCGGCAGA AGAATCGTGA TGGTCAACGG TTCGCCGACC 
GACTCCAACT CGGCGCCGTA CAAGGAGGGC GCGCACGACG TCTTCGACAG ATCCGGCATC 
GACGTCGTCA AGGAGTACGA CACGCCCGAC TGGAGCCCAG ACAGAGCCCA GACCGAGATG 
GAGCAGGCGA TCACGAGCGC CGGCAAGGAC GGCTTCGACG GCGTCTACTC GGCCAACGAC 
GGCATGGCCG GCGGCGTGAT CGCGGCGATG AAGTCGGCCG GCGTCGACCC CAGAACGCGG 
CCCGTCACCG GACAGGACGC CGAGGTCGCG GCGCTGCAGC GGATCCTCAC CGGCGAGCAG 
CTGATGACGA TCTACCAGCC GATCAGCGAG ATCGCCGCGA CCGCCGCCGA GCTGGCGGTG 
CCGCTCGCCA GAGGCGAGGG CGTCCCGTCG ATCACGACGA CCGAGGTCGA CAACGGCGGC 
CCCAGAAGAG TGCCGGCCGT CCTGCTCGAC ACGATCGTGA TCACGAGAGA CAACATCCAG 
GACGTGATCA TCAGAGACGG CTTCGCGACC GCCGAGCAGA TCTGCACCGA CGAGTACAGA 
GCGGCGTGCG CCGAGGCGGG TATCAGATAG

Protein sequence

MSIIRTGTAV VLAGALALGA SACGSDDDGG GSTTAASSGG GGGGEKIALL LPESKTARYE 
NQDRPRFVEK VRELCPDCEV LYSNAEQDPA QQQQQAEQAI TNGARVLVVD AVDVKSAAAI 
ATNAKSQGVP VVSYARLISD AELDAYVSID PFRVGQQQGE ALVRALRGGR RIVMVNGSPT 
DSNSAPYKEG AHDVFDRSGI DVVKEYDTPD WSPDRAQTEM EQAITSAGKD GFDGVYSAND 
GMAGGVIAAM KSAGVDPRTR PVTGQDAEVA ALQRILTGEQ LMTIYQPISE IAATAAELAV 
PLARGEGVPS ITTTEVDNGG PRRVPAVLLD TIVITRDNIQ DVIIRDGFAT AEQICTDEYR 
AACAEAGIR