Gene EcSMS35_2205 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2205
Symbol	lpxK
ID	6144902
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	2217905
End bp	2218891
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	55%
IMG OID	641617081
Product	tetraacyldisaccharide 4'-kinase
Protein accession	YP_001744255
Protein GI	170683237
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1663] Tetraacyldisaccharide-1-P 4'-kinase
TIGRFAM ID	[TIGR00682] tetraacyldisaccharide 4'-kinase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0766314
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	0.274166
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGAAA AAATCTGGTC TGGTGAATCC CCTTTGTGGC GGCTATTGCT GCCACTCTCC 
TGGTTGTATG GCCTGGTGAG TGGCGCGATC CGTCTTTGCT ATAAACTAAA ACTGAAGCGC 
GCCTGGCGTG CCCCCGTACC GGTTGTCGTG GTTGGTAATC TCACCGCAGG CGGCAACGGA 
AAAACCCCGG TCGTTGTCTG GCTGGTGGAA CAGTTGCAAC AGCGCGGTAT TTGCGTGGGG 
GTCGTATCGC GGGGATATGG TGGTAAGGCT GAATCTTATC CGCTGTTATT GTCGGCAGAT 
ACCACCACAG CACAGGCGGG TGATGAACCT GTGTTGATTT ATCAACGCAC TGATGCGCCT 
GTTGCGGTTT CTCCCGTGCG TTCTGATGCG ATAAAAGCCA TTCTGGCGCA ACACCCTGAT 
GTGCAGATCA TCGTAACCGA CGACGGTTTA CAGCATTACC GTCTGGCGCG TGATGTGGAA 
ATTGTCGTTA TTGATGGTGT GCGTCGCTTT GGCAATGGCT GGTGGTTGCC GGCGGGGCCA 
ATGCGTGAGC GAGCGGGGCG CTTAAAGTCG GTTGATGCGG TAATCGTCAA CGGTGGTGTC 
CCCCGCAGCG GTGAAATCCC CATGCATCTG CTGCCGGGTC AGGCGGTGAA TTTACGTACC 
GGTACGCGTT GTGACGTTGC TCAGCTTGAA CATGTGGTGG CGATGGCAGG GATTGGTCAT 
CCGCCGCGCT TTTTTGCCAC GCTGAAGATG TGTGGCGTAC AACCGGAAAA ATGTGTACCG 
CTGGCCGATC ATCAGTCTTT GAATCATGCG GATGTCAGCG CGTTGGTCAG CGCCGGGCAA 
ACGCTGGTAA TGACAGAAAA AGATGCGGTG AAATGCCGGG CCTTTGCAGA AGAAAATTGG 
TGGTATTTGC CTGTAGACGC ACAGCTTTCA GGTGATGAAC CAGCGAAACT GCTTGCGCAA 
CTAACCTCGC TGGCTTCTGG CAACTAG

Protein sequence

MIEKIWSGES PLWRLLLPLS WLYGLVSGAI RLCYKLKLKR AWRAPVPVVV VGNLTAGGNG 
KTPVVVWLVE QLQQRGICVG VVSRGYGGKA ESYPLLLSAD TTTAQAGDEP VLIYQRTDAP 
VAVSPVRSDA IKAILAQHPD VQIIVTDDGL QHYRLARDVE IVVIDGVRRF GNGWWLPAGP 
MRERAGRLKS VDAVIVNGGV PRSGEIPMHL LPGQAVNLRT GTRCDVAQLE HVVAMAGIGH 
PPRFFATLKM CGVQPEKCVP LADHQSLNHA DVSALVSAGQ TLVMTEKDAV KCRAFAEENW 
WYLPVDAQLS GDEPAKLLAQ LTSLASGN