Gene SbBS512_E4051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E4051
Symbol	waaW
ID	6271032
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	3784183
End bp	3785208
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	37%
IMG OID	641727891
Product	lipopolysaccharide 1,2-galactosyltransferase
Protein accession	YP_001882323
Protein GI	187733640
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1442] Lipopolysaccharide biosynthesis proteins, LPS:glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATTTAT TAGCTGAGAG TATTACTGAA GTCGCTGTCT CTGGGGAAAT TGCTAACACC 
GATCGTGTGT TAAATATCGC TTACGGTATT GACCGTAACT TTTTATTTGG TGCGGCAGTA 
TCTATGCAAT CAGTTGTTAT GCATAACCCG GACCTTGCGG TTAAGTTTCA TCTCTTTACC 
GACTACATTG ATGAAGATTA TCTACAACGT GTTAATGCTT TTACCAGCAA AAATGCTAAC 
GTTGAAGTAA TAATTTATAA AGTCTCCAAT GCCTTTATTG ATATCTTCCC CAGCCTGAAA 
CAGTGGTCTT ATGCAACATT CTTCCGTTTA GTTGCGTTCC AGTATTTGAG TGAAACTATT 
GAAAATCTGT TATATATCGA TGCTGATGTC ATCTGTAAAG GCTCATTAGC TGGATTGCTT 
GATATTAATT TTGATGAGGA TAAGTTCGCA GCTGTTATTA AAGATGTGCC TTTTATGCAG 
GAAAAACCAG CGAAGCGTCT GGCTATAGAG GGACTTCCAG GGAATTATTT CAACGCCGGT 
GTAGTATATC TGCAGCTTGA AGCATGGGCG AAAAATGATT TTATGAATAA AGCCATTGCT 
ATGCTGGCAA GTGACCCGCA GCACACGAAG TATAAATGCC TTGATCAGGA TATTTTAAAT 
ATTCTGTTCT TTGGTCATTG TAATTTTATT AGCGGCGATT ATGATTGCTT TTATGGCATT 
GACTATGAGT TAAAAAATAA AAGCGATGAA GATTATAAAA AGACCATTAC CGATGATACT 
AAGCTGATTC ATTATGTTGG CGTAACGAAG CCCTGGAACG ACTGGACGAA TTATCCCTGC 
CAGAAGTATT TTAATGAGGC TTATCAGGCT TCTTGCTGGA ATGATGTGGC GTTTATTCCA 
GCCACGAATG AAAAGCAGTA TCAAGTGAAA TATCAACATG CAAAGAAAAA TGGTGATACG 
TTTAACGCTT TTATTTACTT CATTAAATTT AAATTAAATA AGTATAAAAG AAAACTATTT 
GGATAA

Protein sequence

MDLLAESITE VAVSGEIANT DRVLNIAYGI DRNFLFGAAV SMQSVVMHNP DLAVKFHLFT 
DYIDEDYLQR VNAFTSKNAN VEVIIYKVSN AFIDIFPSLK QWSYATFFRL VAFQYLSETI 
ENLLYIDADV ICKGSLAGLL DINFDEDKFA AVIKDVPFMQ EKPAKRLAIE GLPGNYFNAG 
VVYLQLEAWA KNDFMNKAIA MLASDPQHTK YKCLDQDILN ILFFGHCNFI SGDYDCFYGI 
DYELKNKSDE DYKKTITDDT KLIHYVGVTK PWNDWTNYPC QKYFNEAYQA SCWNDVAFIP 
ATNEKQYQVK YQHAKKNGDT FNAFIYFIKF KLNKYKRKLF G