Gene SbBS512_E1175 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E1175
Symbol	wcaC
ID	6270773
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	1078104
End bp	1079321
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	54%
IMG OID	641725307
Product	putative glycosyl transferase
Protein accession	YP_001879821
Protein GI	187731835
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATATTT TGCAATTTAA TGTGCGACTG GCGGAAGGCG GGGCAGCAGG TGTGGCGTTA 
GATCTCCACC AGCGTGCGCT GCAACAGGGG CTAGCGTCAC ATTTTGTCTA CGGTTACGGC 
AAAGGCGGCA AAGAGAGCGT CAGCCATCAA AACTATCCGC AGGTCATCAA ACATACGCCG 
CGGATGACTG CAATGGCGAA TATTGTCCTG TTTCGTCTGT TTAATCGCGA TCTGTTTGGC 
AATTTCAATG AGTTATATCG CACCATTACT CGTACACCGG GTCCGGTGGT CCTGCATTTT 
CATGTGCTGC ACAGCTACTG GCTAAATCTT AAGAGCGTGG TGCGCTTTTG CGAAAAGGTG 
AAAAACCATA AACCGGACGT CACTCTGGTC TGGACGCTGC ACGACCACTG GAGCGTTACC 
GGACGCTGCG CCTTTACCGA CGGTTGTGAA GGCTGGAAAA CGGGCTGCCA GAAATGCCCG 
ACCTTAAATA ACTATCCGCC GGTGAAGATT GATCGGGCGC ACCAGCTGGT GGCGGGCAAA 
CGCCAGTTAT TCCGTGAGAT GCTGGCGCTG GGCTGTCAGT TTATTTCCCC CAGCCAGCAT 
GTGGCTGACG CTTTCAATAG CCTGTACGGT CCAGGGCGTT GCCGGATTAT CAATAATGGT 
ATTGATATGG CAACCGAAGC GATTCTGGCG GATCTGCCTC CGGTGCGCGA AACCCAGGGC 
AAGCCGAAAA TCGCTGTGGT GGCGCATGAC CTGCGTTACG ACGGCAAAAC TAACCAGCAA 
CTGGTGCGTG AGATGATGGC GCTGGGCGAC AAAATCGAAC TGCATACCTT TGGTAAGTTC 
TCGCCGTTCA CCGCTGGCAA CGTGGTTAAT CACGGCTTTG AAACCGACAA ACGTAAGCTG 
ATGAGCGCGC TCAATCAGAT GGATGCGCTG GTATTCAGTT CTCGCGTCGA TAACTACCCG 
CTGATTTTGT GTGAGGCGCT ATCGATTGGC GTGCCGGTGA TTGCCACCCA TAGCGATGCG 
GCGCGGGAAG TGTTGCAAAA ATCCGGCGGT AAAACCGTCA GCGAAGAAGA GGTGCTGCAA 
CTGGTGCAGT TAAGCAAACC GGAAATCGCG CAGGCGATAT TTGGTACCAC GCTGGCTGAG 
TTCAGCCAAC GCAGCCGCGC CGCCTACAGT GGACAACAGA TGCTGGAGGA GTATGTCAAC 
TTCTATCAGA ATCTGTAG

Protein sequence

MNILQFNVRL AEGGAAGVAL DLHQRALQQG LASHFVYGYG KGGKESVSHQ NYPQVIKHTP 
RMTAMANIVL FRLFNRDLFG NFNELYRTIT RTPGPVVLHF HVLHSYWLNL KSVVRFCEKV 
KNHKPDVTLV WTLHDHWSVT GRCAFTDGCE GWKTGCQKCP TLNNYPPVKI DRAHQLVAGK 
RQLFREMLAL GCQFISPSQH VADAFNSLYG PGRCRIINNG IDMATEAILA DLPPVRETQG 
KPKIAVVAHD LRYDGKTNQQ LVREMMALGD KIELHTFGKF SPFTAGNVVN HGFETDKRKL 
MSALNQMDAL VFSSRVDNYP LILCEALSIG VPVIATHSDA AREVLQKSGG KTVSEEEVLQ 
LVQLSKPEIA QAIFGTTLAE FSQRSRAAYS GQQMLEEYVN FYQNL