Gene EcSMS35_0193 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0193
Symbol	lpxB
ID	6144108
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	212530
End bp	213678
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	54%
IMG OID	641615094
Product	lipid-A-disaccharide synthase
Protein accession	YP_001742310
Protein GI	170681777
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0763] Lipid A disaccharide synthetase
TIGRFAM ID	[TIGR00215] lipid-A-disaccharide synthase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.000445848
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGAAC AGCGTCCATT AACGATTGCC CTGGTCGCCG GAGAAACCTC CGGCGATATC 
CTGGGGGCCG GTTTAATCCG TGCTCTGAAA GAACGTGTGC CCAATGCCCG CTTTGTTGGT 
GTTGCCGGGC CACGAATGCA AGCCGAAGGC TGCGAAGCCT GGTACGAAAT GGAAGAGCTG 
GCGGTGATGG GCATTGTTGA AGTGCTCGGG CGTCTGCGTC GCTTACTGCA TATTCGTGCC 
GATCTGACAA AGCGTTTTGG CGAACTGAAG CCAGATGTTT TTGTCGGTAT TGATGCGCCA 
GACTTCAATA TTACTCTTGA AGGTAACCTC AAAAAGCAGG GTGTCAAAAC CATTCATTAC 
GTTAGTCCGT CCGTCTGGGC GTGGCGACAG AAACGCGTTT TCAAAATAGG CAGAGCCACC 
GATCTGGTGC TCGCATTTCT GCCTTTCGAA AAGGCGTTTT ATGACAAATA CAACGTACCG 
TGCCGCTTTA TCGGTCATAC CATGGCTGAT GCCATGCCAT TAGATCCAGA TAAAAATGGT 
GCCCGTGATG TGCTGGGTAT CCCTTACGAT GCCCACTGTC TGGCATTGTT GCCGGGCAGC 
CGTGGTGCAG AAGTCGAAAT GCTTAGTGCC GATTTCCTGA AAACGGCCCA GCTTTTGCGT 
CAGACATATC CCGATCTCGA GATCGTGGTG CCGCTGGTGA ATGCCAAACG CCGCGAGCAG 
TTTGAGCGTA TCAAAGCTGA AGTCGCACCG GACCTTGCTG TTCATCTGCT GGATGGAATG 
GGCCGTGAGG CGATGGTCGC CAGTGATGCG GCGCTACTGG CGTCGGGTAC GGCAGCCCTG 
GAGTGCATGC TGGCGAAATG CCCGATGGTG GTGGGATATC GCATGAAGCC TTTTACCTTC 
TGGCTGGCGA AGCGGCTGGT GAAAACCGAG TATGTCTCGC TGCCAAATTT GCTGGCGGGC 
AGAGAGTTAG TCAAAGAGTT ATTGCAGGAA GAGTGTGAGC CGCAAAAACT GGCTGCGGCG 
CTGTTACCGC TGTTGGCGAA CGGGAAAACC AGTCACGCGA TGCACGATAC CTTCCGTGAA 
CTGCATCAGC AGATCCGCTG CAATGCCGAT GAGCAGGCGG CACAAGCCGT TCTGGAGTTA 
GCACAATGA

Protein sequence

MTEQRPLTIA LVAGETSGDI LGAGLIRALK ERVPNARFVG VAGPRMQAEG CEAWYEMEEL 
AVMGIVEVLG RLRRLLHIRA DLTKRFGELK PDVFVGIDAP DFNITLEGNL KKQGVKTIHY 
VSPSVWAWRQ KRVFKIGRAT DLVLAFLPFE KAFYDKYNVP CRFIGHTMAD AMPLDPDKNG 
ARDVLGIPYD AHCLALLPGS RGAEVEMLSA DFLKTAQLLR QTYPDLEIVV PLVNAKRREQ 
FERIKAEVAP DLAVHLLDGM GREAMVASDA ALLASGTAAL ECMLAKCPMV VGYRMKPFTF 
WLAKRLVKTE YVSLPNLLAG RELVKELLQE ECEPQKLAAA LLPLLANGKT SHAMHDTFRE 
LHQQIRCNAD EQAAQAVLEL AQ