Gene ECH74115_1076 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1076
Symbol	lpxK
ID	6969538
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	1101364
End bp	1102350
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	55%
IMG OID	643385088
Product	tetraacyldisaccharide 4'-kinase
Protein accession	YP_002269587
Protein GI	209399961
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1663] Tetraacyldisaccharide-1-P 4'-kinase
TIGRFAM ID	[TIGR00682] tetraacyldisaccharide 4'-kinase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0122696
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	64
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGAAA AAATCTGGTC TGGTGAATCC CCTTTGTGGC GGCTATTGCT GCCACTCTCC 
TGGTTGTATG GCCTGGTGAG TGGCGCGATC CGTCTTTGCT ATAAACTAAA ACTGAAGCGC 
GCCTGGCGTG CCCCCGTACC GGTTGTCGTG GTTGGTAATC TCACCGCAGG CGGCAACGGA 
AAAACCCCGG TCGTTGTCTG GCTGGTGGAA CAGTTGCAAC AGCGCGGTAT TCGCGTGGGG 
GTCGTATCGC GGGGATATGG TGGTAAGGCT GAATCTTATC CGCTGTTATT GTCGGCAGAT 
ACCACCACAG CACAGGCGGG TGATGAACCT GTGTTGATTT ATCAACGCAC TGATGCGCCT 
GTTGCGGTTT CTCCCGTTCG TTCTGATGCG GTAAAAGCCA TTCTGGCGCA ACACCCTGAT 
GTGCAGATCA TCGTAACCGA CGACGGTTTA CAGCATTACC GTCTGGCGCG TGATGTGGAA 
ATTGTCGTTA TTGATGGTGT GCGTCGCTTT GGCAATGGCT GGTGGTTGCC GGCGGGGCCA 
ATGCGTGAGC GAGCGGGGCG CTTAAAGTCA GTTGATGCGG TAATCGTCAA CGGCGGTGTC 
CCCCGCAGCG GTGAAATCCC CATGCATCTG CTGCCGGGTC AGGCGGTGAA TTTACGTACC 
GGTACGCGTT GTGACGTTGC TCAGCTTGAA CATGTGGTGG CGATGGCAGG GATTGGGCAT 
CCGCCGCGCT TTTTTGCCAC GCTGAAGATG TGCGGCGTAC AACCGGAAAA ATGTGTACCG 
CTGGCCGATC ATCAGTCTTT GAACCATGCG GATGTCAGCG CGTTGGTAAG CACCGGGCAA 
ACGCTGGTAA TGACTGAAAA AGATGCGGTG AAATGCCGGG CCTTTGCAGA AGAAAATTGG 
TGGTATTTGC CCGTTGACGC ACAGCTTTCA GGTGATGAAC CAGCGAAACT GCTTGCGCAA 
CTAACCTCGC TGGCTTCTGG CAACTAG

Protein sequence

MIEKIWSGES PLWRLLLPLS WLYGLVSGAI RLCYKLKLKR AWRAPVPVVV VGNLTAGGNG 
KTPVVVWLVE QLQQRGIRVG VVSRGYGGKA ESYPLLLSAD TTTAQAGDEP VLIYQRTDAP 
VAVSPVRSDA VKAILAQHPD VQIIVTDDGL QHYRLARDVE IVVIDGVRRF GNGWWLPAGP 
MRERAGRLKS VDAVIVNGGV PRSGEIPMHL LPGQAVNLRT GTRCDVAQLE HVVAMAGIGH 
PPRFFATLKM CGVQPEKCVP LADHQSLNHA DVSALVSTGQ TLVMTEKDAV KCRAFAEENW 
WYLPVDAQLS GDEPAKLLAQ LTSLASGN