Gene EcE24377A_4127 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_4127
Symbol	waaW
ID	5588286
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	4117297
End bp	4118322
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	37%
IMG OID	640927746
Product	lipopolysaccharide 1,2-galactosyltransferase
Protein accession	YP_001465106
Protein GI	157155439
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1442] Lipopolysaccharide biosynthesis proteins, LPS:glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.223071
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATTTAT TAGCTGAGAG TATTACTGAA GTCGCTGTCT CTGGGGAAAT TGCTAACACC 
GATCGTGTGT TAAATATCGC TTACGGTATT GACCGTAACT TTTTATTTGG TGCGGCAGTA 
TCTATGCAAT CAGTTGTTAT GCATAACCCG GACCTTGCGG TTAAGTTTCA TCTCTTTACC 
GACTACATTG ATGAAGATTA TCTACAACGT GTTAATGCTT TTACCAGCAA AAATGCTAAC 
GTTGAAGTAA TAATTTATAA AGTCTCCAAT GTCTTTATTG ATATCTTCCC CAGCCTGAAA 
CAGTGGTCTT ATGCAACATT CTTCCGTTTA GTTGCGTTCC AGTATTTGAG TGAAACTATT 
GAAAATCTGT TATATATCGA TGCTGATGTC ATCTGTAAAG GCTCATTAGC TGGATTGCTT 
GATATTAATT TTGATGAGGA TAAGTTCGCA GCTGTTATTA AAGATGTGCC TTTTATGCAG 
GAAAAACCAG CGAAGCGTCT GGCTATAGAG GGACTTCCAG GGAATTATTT CAACGCCGGT 
GTAGTATATC TGCAGCTTGA AGCATGGGCG AAAAATGATT TTATGAATAA AGCCATTGCT 
ATGCTGGCAA GTGACCCGCA GCACACGAAG TATAAATGCC TTGATCAGGA TATTTTAAAT 
ATTCTGTTCT TTGGTCATTG TATTTTTATT AGCAGCGATT ATGATTGCTT TTATGGCATT 
GACTATGAGT TAAAAAATAA AAGCGATGAA GATTATAAAA AGACCATTAC CGATGATACT 
AAGCTGATTC ATTATGTTGG CGTAACGAAG CCCTGGAACG ACTGGACGAA TTATCCCTGC 
CAGAAGTATT TTAATGAGGC TTATCAGGCT TCTTGCTGGA ATGATGTGGC GTTTATTCCA 
GCCACGAATG AAAAGCAGTA TCAAGTGAAA TATCAACATG CAAAGAAAAA TGGTGATACG 
TTTAACGCTT TTATTTACTT CATTAAATTT AAATTAAATA AGTATAAAAG AAAACTATTT 
GGATAA

Protein sequence

MDLLAESITE VAVSGEIANT DRVLNIAYGI DRNFLFGAAV SMQSVVMHNP DLAVKFHLFT 
DYIDEDYLQR VNAFTSKNAN VEVIIYKVSN VFIDIFPSLK QWSYATFFRL VAFQYLSETI 
ENLLYIDADV ICKGSLAGLL DINFDEDKFA AVIKDVPFMQ EKPAKRLAIE GLPGNYFNAG 
VVYLQLEAWA KNDFMNKAIA MLASDPQHTK YKCLDQDILN ILFFGHCIFI SSDYDCFYGI 
DYELKNKSDE DYKKTITDDT KLIHYVGVTK PWNDWTNYPC QKYFNEAYQA SCWNDVAFIP 
ATNEKQYQVK YQHAKKNGDT FNAFIYFIKF KLNKYKRKLF G