Gene EcSMS35_1016 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1016
Symbol	wzxC
ID	6146636
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1035406
End bp	1036884
Gene Length	1479 bp
Protein Length	492 aa
Translation table	11
GC content	54%
IMG OID	641615903
Product	colanic acid exporter
Protein accession	YP_001743095
Protein GI	170681740
COG category	[R] General function prediction only
COG ID	[COG2244] Membrane protein involved in the export of O-antigen and teichoic acid
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.6233
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTTAC GTGAAAAAAC CATCAGCGGC GCGAAGTGGT CGGCGATTGC CACGGTAATC 
ATTATCGGCC TCGGGCTGGT GCAGATGACC GTGCTGGCGC GGATTATCGA CAACCACCAG 
TTCGGCCTGC TTACCGTGTC GCTGGTGATT ATCGCGCTGG CAGATACGCT TTCTGACTTC 
GGTATCGCTA ACTCGATTAT TCAGCGAAAA GAAATCAGTC ACCTGGAACT TACCACGTTG 
TACTGGCTGA ACGTCGGGCT GGGGCTTGTG GTGTGTGTGG CGGTGTTTTT GTTGAGTGAT 
CTCATTGGTG ACGTGCTGAA CAACCCGGAC CTGGCACCGT TGATTAAAAC ATTGTCGCTG 
GCGTTTGTGG TGATCCCCCA CGGGCAGCAG TTCCGCGCGT TGATGCAAAA AGAGCTGGAG 
TTCAACAAAA TCGGCATGAT CGAAACCAGC GCGGTGCTGG CGGGCTTTAC TTTTACGGTG 
GTTAGCGCCC ATTTCTGGCC ACTGGCGATG ACCGCGATCC TCGGTTATCT GGTCAATAGT 
GCGGTAAGAA CGCTGCTGTT TGGCTACTTT GGTCGCAAAA TTTATCGCCC CGGTCTGCAT 
TTCTCGCTGG CGTCGGTGGC ACCGAACTTA CGCTTTGGTG CCTGGCTGAC GGCGGACAGC 
ATCATCAACT ATCTCAATAC CAACCTTTCA ACGCTGGTGC TGGCGCGTAT TCTCGGCGCG 
GGCGTGGCAG GGGGATACAA CCTGGCGTAC AACGTGGCCG TTGTGCCGCC GATGAAGCTG 
AACCCAATCA TCACCCGCGT GTTGTTTCCG GCATTTGCCA AAATTCAGGA CGACACCGAA 
AAGCTGCGCG TTAACTTCTA CAAGCTGCTG TCGGTAGTGG GGATTATCAA CTTTCCGGCG 
CTGCTGGGGC TGATGGTGGT GTCGAATAAC TTTGTACCGC TGGTCTTTGG TGAGAAGTGG 
AACAGCATTA TTCCGGTGCT GCAATTGCTG TGTGTGGTGG GGCTGCTGCG CTCAGTGGGG 
AACCCGATTG GTTCGCTGCT GATGGCGAAA GCGCGGGTCG ATATCAGCTT TAAATTCAAC 
GTATTCAAAA CCTTTCTGTT TATTCCGGCG ATTGTTATTG GTGGGCAGAT GGCGGGCGCA 
ATCGGCGTCA CGCTTGGCTT CCTGCTGGTG CAGATTATCA ACACCATTCT GAGCTATTTC 
GTGATGATTA AACCGGTGCT CGGTTCCAGT TATCGCCAGT ACATCCTGAG TTTGTGGCTG 
CCGTTTTACC TCTCGCTGCC GACGCTGGGG GTCAGTTATG CGCTGGGCAT TGTGCTGAAA 
GGGCAACTGG CGCTGGGGAT GCTGCTGGCG GTGCAAATAG CCGCGGGCGT GCTGGCGTTT 
GTGGTGATGA TTGTGCTGTC GCGCCATTCG TTGGTGGTGG AAGTGAAGCG TCAGTTTTGT 
CGCAGCGAAA AAATGAAAAT GCTTTTACGG GCGGGGTGA

Protein sequence

MSLREKTISG AKWSAIATVI IIGLGLVQMT VLARIIDNHQ FGLLTVSLVI IALADTLSDF 
GIANSIIQRK EISHLELTTL YWLNVGLGLV VCVAVFLLSD LIGDVLNNPD LAPLIKTLSL 
AFVVIPHGQQ FRALMQKELE FNKIGMIETS AVLAGFTFTV VSAHFWPLAM TAILGYLVNS 
AVRTLLFGYF GRKIYRPGLH FSLASVAPNL RFGAWLTADS IINYLNTNLS TLVLARILGA 
GVAGGYNLAY NVAVVPPMKL NPIITRVLFP AFAKIQDDTE KLRVNFYKLL SVVGIINFPA 
LLGLMVVSNN FVPLVFGEKW NSIIPVLQLL CVVGLLRSVG NPIGSLLMAK ARVDISFKFN 
VFKTFLFIPA IVIGGQMAGA IGVTLGFLLV QIINTILSYF VMIKPVLGSS YRQYILSLWL 
PFYLSLPTLG VSYALGIVLK GQLALGMLLA VQIAAGVLAF VVMIVLSRHS LVVEVKRQFC 
RSEKMKMLLR AG