Gene Cwoe_2028 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cwoe_2028
Symbol
ID	8732471
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Conexibacter woesei DSM 14684
Kingdom	Bacteria
Replicon accession	NC_013739
Strand	+
Start bp	2129977
End bp	2131014
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	66%
IMG OID	646502647
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_003393829
Protein GI	284043489
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCGG CCCTGATCGC TGCTGGCTGC GGAAGCAGCG GCGACGACAC GACGTCGACG 
ACATCGACGG GCGTGTCGAC GTCCGCCGGG ATGTCCCCCA CCGCGTCGGG CGGGATCACC 
GTCGGATACT CGGACCCGGT CGCATCGAAC CCTGCTCAGC AGGCTGTGGC CCGCGGACAG 
GAGGAAGCGG CGAAGGAGTT CGGCTGGGAC CTCGTGCACT TGGACGCGAA CCTGTCCGCG 
TCCAAGCAGG TCTCGGACAT CGACACGCTC ATCTCGAAGA AGGTCGATGC GATCAACTCG 
TTCACCATCG ATCAGGGTGC CGCCGATGCC GTCTATCAGC GCGCGAGCCA GGCGGGCATC 
CCCGTGATTG GACAGTCATC CAGGTCCAAG TACATCCAGT CGTCGGTCTG GAACCAGCAG 
AACTTCGACT GCAGCGTGGC CGCGAAGGCG GCGGCGTACA TCAACGCGCG CACGCCCGGG 
GCGAAGACGC TGGTCATCGG CGGGCCGCCC GTCGGCGCGA TCACGCAGTA CGTGAATTGC 
TTCCAGGACG AGGCGGAGAA GGCCGGCCTG GACGTGCTCG AGAAGAAGGA CAACACGACC 
GACACCGCCT CGGGCGGGCA GCCGATCGCG GCCGCGCTGA TCAACAAGCA CCCCGACGTG 
CAGGCGATCT GGTGTTACAA CGACCCGAGC TGCCTCGGTG CCGGCAACGC CCTCAAGGCG 
GCGGGCAAGA AGATCTGGAA GCAGGGCGAG TCGGACTCCG GCGTCATCGT GATCGGCTCG 
AACGGGTCGA CCGACGGGAT CAGCGCCATC AAGAGCGGTT TGATGACGGT CTCCTACGAC 
ATCAACCCCG ACAAGGTCGG CGCGTCGGTG ATCGCGCTGC TGGCCAAGCA CTTCGAGGAT 
GGCGTGCCCG TGAAGGACCT GCCCAAGGAC GTCGTGGTCC CGACCACGGA ATGGGACGCT 
TCCAACGTCG GTGACTACGT CGATCCGATC AAGCGCTCGA TCGACACCAA GACCGTCGAC 
GTCGACGGCC AGGGCTGA

Protein sequence

MSAALIAAGC GSSGDDTTST TSTGVSTSAG MSPTASGGIT VGYSDPVASN PAQQAVARGQ 
EEAAKEFGWD LVHLDANLSA SKQVSDIDTL ISKKVDAINS FTIDQGAADA VYQRASQAGI 
PVIGQSSRSK YIQSSVWNQQ NFDCSVAAKA AAYINARTPG AKTLVIGGPP VGAITQYVNC 
FQDEAEKAGL DVLEKKDNTT DTASGGQPIA AALINKHPDV QAIWCYNDPS CLGAGNALKA 
AGKKIWKQGE SDSGVIVIGS NGSTDGISAI KSGLMTVSYD INPDKVGASV IALLAKHFED 
GVPVKDLPKD VVVPTTEWDA SNVGDYVDPI KRSIDTKTVD VDGQG