Gene EcolC_3478 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3478
Symbol	lpxB
ID	6068300
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	3795297
End bp	3796445
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	54%
IMG OID	641602894
Product	lipid-A-disaccharide synthase
Protein accession	YP_001726419
Protein GI	170021465
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0763] Lipid A disaccharide synthetase
TIGRFAM ID	[TIGR00215] lipid-A-disaccharide synthase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00171417
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0362862
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGAAC AGCGTCCATT AACGATTGCC CTGGTCGCCG GAGAAACCTC CGGCGATATC 
CTGGGGGCCG GTTTAATCCG CGCTCTGAAA GAACGTGTGC CCAACGCCCG CTTTGTTGGC 
GTTGCCGGGC CACGAATGCA GGCTGAAGGC TGCGAAGCCT GGTACGAAAT GGAAGAACTG 
GCGGTGATGG GCATTGTTGA AGTGCTCGGT CGTCTGCGTC GCTTACTGCA TATTCGTGCC 
GATCTGACAA AGCGTTTTGG CGAACTGAAG CCAGATGTTT TTGTTGGTAT TGATGCGCCC 
GACTTCAATA TTACTCTTGA AGGTAACCTC AAAAAGCAGG GTATCAAAAC CATTCATTAC 
GTCAGTCCAT CCGTCTGGGC GTGGCGACAG AAACGCGTTT TCAAAATAGG CAGAGCCACC 
GATCTGGTGC TCGCATTTCT GCCTTTCGAA AAAGCGTTTT ATGACAAATA CAATGTACCG 
TGCCGCTTTA TCGGTCATAC CATGGCTGAT GCCATGCCGT TAGATCCAGA TAAAAATGGT 
GCCCGTGATG TGCTGGGGAT CCCTTACGAT GCCCACTGTC TGGCATTGTT GCCGGGCAGC 
CGTGGTGCAG AAGTCGAAAT GCTTAGTGCC GATTTCCTGA AAACTGCCCA GCTTTTGCGC 
CAGACATATC CGGATCTCGA AATCGTGGTG CCGCTGGTGA ATGCCAAACG CCGCGAGCAG 
TTTGAACGCA TCAAAGCTGA AGTCGCGCCA GATCTGTCGG TTCATTTGCT GGATGGAATG 
GGCCGTGAGG CGATGGTCGC CAGCGATGCG GCACTACTGG CGTCGGGGAC GGCAGCCCTG 
GAGTGTATGC TGGCGAAATG CCCGATGGTG GTGGGATATC GCATGAAGCC TTTTACCTTC 
TGGTTGGCGA AGCGGCTGGT GAAAACTGAT TATGTCTCGC TGCCAAATCT GCTGGCGGGC 
AGAGAGTTAG TCAAAGAGTT ATTGCAGGAA GAGTGTGAGC CGCAAAAACT GGCTGCGGCG 
CTGTTACCGC TGTTGGCGAA CGGGAAAACC AGCCACGCGA TGCACGATAC CTTCCGTGAA 
CTGCATCAGC AGATCCGCTG CAATGCCGAT GAGCAGGCGG CACAAGCCGT TCTGGAGTTA 
GCACAATGA

Protein sequence

MTEQRPLTIA LVAGETSGDI LGAGLIRALK ERVPNARFVG VAGPRMQAEG CEAWYEMEEL 
AVMGIVEVLG RLRRLLHIRA DLTKRFGELK PDVFVGIDAP DFNITLEGNL KKQGIKTIHY 
VSPSVWAWRQ KRVFKIGRAT DLVLAFLPFE KAFYDKYNVP CRFIGHTMAD AMPLDPDKNG 
ARDVLGIPYD AHCLALLPGS RGAEVEMLSA DFLKTAQLLR QTYPDLEIVV PLVNAKRREQ 
FERIKAEVAP DLSVHLLDGM GREAMVASDA ALLASGTAAL ECMLAKCPMV VGYRMKPFTF 
WLAKRLVKTD YVSLPNLLAG RELVKELLQE ECEPQKLAAA LLPLLANGKT SHAMHDTFRE 
LHQQIRCNAD EQAAQAVLEL AQ