Gene Cwoe_2037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cwoe_2037
Symbol
ID	8732480
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Conexibacter woesei DSM 14684
Kingdom	Bacteria
Replicon accession	NC_013739
Strand	+
Start bp	2138305
End bp	2139480
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	68%
IMG OID	646502656
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_003393838
Protein GI	284043498
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.476065
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAGAA CGCTGTGGCG AGCCGGAGCG CTCGCCGAAG ACGCCGCCGA GCGCGCGGAT 
CGTGAGGGAG CCAGCAGCGC GCGCAGGCTC GTCTCGGCTC GTCGGGCCGG ACTGGCAGCG 
CTCGCGCTGG CGGGGCTGGT CGTGGCCGGG TGCGGCTCGG GCGACAAGGG CAGCGGCGGT 
GGCTCGACCG CGGCGTCGAC GTCGCAGCAC GACAGGAAGA TCGTCGTGGG CTACTCCGAC 
CCTGTCGGAT CGAATCAGGC CCAGCAGGCG GTCTATCGCG CGCAGAAGGA GGCGGCCAAG 
CAGCTGGGCT GGGAGATCGT GCACCTGGAC GCGAACCTCT CGCCGTCCAA GCAGCTGTCG 
GACATCGATT CGATGATCTC GCGCAAGGTC GACGCGATCA ACTCGTGGAC GTTGGAAGAG 
GGCGCCGCCG ACGCCGCCTA CCGGCGGGCC GTGGAGGCGG GGATCGTGAT CGTTGGGCAG 
TCGACCGCCT CGCCGTACAT GAGCTCGACG GTGTGGCTCC AGCAGAATTA CGGGTGCAGC 
CTCGCCAAGA TGGGCGCAAA GTACATCGCC GACCGCCGCC CTGGTGCCAA GACGCTCGTC 
ATCGGCGGCC CACCGGTGAA GGCGATCACC CACTACGCCC AGTGCTTTCT GGACGCGGCC 
AAGGCGGCCG GCCTCACCGT CCTCGACAAG AAGGACAACA TGGCCGACAC GGCGGCTGGA 
TCGCAGCCCA TCGCGGCGGC GATGGTCAAC CAGCATCCTG ACGTGGAGGC CGTCTGGACC 
TACAACGATC CGACGGCGCT CGGTGCCGGC AACGCGCTGA AGGCGGCGGG CAAGCAGGTC 
TGGCAGGAGG GCAAGAGCGA CGACGGGGTG ATCGTCATCG GGTCCAACGG CACCGAGGAA 
GGCATCCAGG GGATCAAGAG CGGGCTGATG ACCGTCACCT ACGACATGCA CCCCGACGTG 
ATCGGCACCC AGATCATCGC GGTGCTCGCC AAGCATTTCC GCGACGGTGT GCCCGCCAAG 
GACCTCCCGA AGAACGTCGT CGTCCCGACG ACCAAATGGG ACCTCTCGAA CGTCGCTGAC 
TACGTCGACC CCATGAAGCG CCCCATCAAG TTGGGCGCCG TGCTGGGCAC TGGCGAGAAC 
TCGGCCGGCC AGGGCGACCA CGAGATCACG AGATGA

Protein sequence

MTRTLWRAGA LAEDAAERAD REGASSARRL VSARRAGLAA LALAGLVVAG CGSGDKGSGG 
GSTAASTSQH DRKIVVGYSD PVGSNQAQQA VYRAQKEAAK QLGWEIVHLD ANLSPSKQLS 
DIDSMISRKV DAINSWTLEE GAADAAYRRA VEAGIVIVGQ STASPYMSST VWLQQNYGCS 
LAKMGAKYIA DRRPGAKTLV IGGPPVKAIT HYAQCFLDAA KAAGLTVLDK KDNMADTAAG 
SQPIAAAMVN QHPDVEAVWT YNDPTALGAG NALKAAGKQV WQEGKSDDGV IVIGSNGTEE 
GIQGIKSGLM TVTYDMHPDV IGTQIIAVLA KHFRDGVPAK DLPKNVVVPT TKWDLSNVAD 
YVDPMKRPIK LGAVLGTGEN SAGQGDHEIT R