Gene EcSMS35_0101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0101
Symbol	lpxC
ID	6145349
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	113191
End bp	114108
Gene Length	918 bp
Protein Length	305 aa
Translation table	11
GC content	51%
IMG OID	641615002
Product	UDP-3-O-[3-hydroxymyristoyl] N-acetylglucosamine deacetylase
Protein accession	YP_001742218
Protein GI	170681175
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0774] UDP-3-O-acyl-N-acetylglucosamine deacetylase
TIGRFAM ID	[TIGR00325] UDP-3-0-acyl N-acetylglucosamine deacetylase

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000000241937
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	0.583142
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAAAC AAAGGACACT TAAACGTATC GTTCAGGCGA CGGGTGTCGG TTTACATACC 
GGCAAGAAAG TCACCCTGAC GTTACGCCCT GCGCCGGCCA ACACCGGGGT CATCTATCGT 
CGCACCGACT TGAATCCACC GGTAGATTTC CCGGCCGATG CCAAATCTGT GCGTGATACC 
ATGCTCTGTA CGTGTCTGGT CAACGAGCAT GATGTACGGA TTTCAACCGT AGAGCACCTC 
AATGCTGCTC TCGCGGGCTT GGGCATCGAT AACATTGTTA TCGAAGTTAA CGCGCCGGAA 
ATCCCGATCA TGGACGGCAG CGCCGCTCCG TTTGTATACC TGCTGCTTGA CGCCGGTATC 
GACGAGCTGA ACTGCGCCAA GAAATTTGTT CGCATCAAAG AGACTGTTCG TGTCGAAGAT 
GGCGATAAGT GGGCTGAATT TAAGCCGTAC AATGGTTTTT CGCTGGATTT CACCATCGAT 
TTTAACCATC CGGCTATTGA TTCCAGCAAC CAGCGCTATG CGATGAACTT CTCCGCTGAT 
GCGTTTATGC GCCAGATCAG CCGTGCGCGT ACGTTCGGTT TCATGCGTGA TATCGAATAT 
CTGCAGTCCC GTGGTTTGTG CCTGGGCGGC AGCTTCGATT GTGCCATCGT TGTTGACGAT 
TATCGCGTAC TGAACGAAGA CGGCCTGCGT TTTGAAGACG AATTTGTGCG TCACAAAATG 
CTCGATGCGA TCGGTGACTT GTTCATGTGT GGTCACAATA TTATTGGTGC ATTTACCGCT 
TATAAATCTG GTCATGCACT GAATAACAAA CTGCTGCAGG CTGTCCTTGC AAAACAGGAA 
GCCTGGGAAT ATGTGACCTT CCAGGACGAC GCAGAACTGC CGTTGGCCTT CAAAGCGCCT 
TCAGCCGTAC TGGCATAA

Protein sequence

MIKQRTLKRI VQATGVGLHT GKKVTLTLRP APANTGVIYR RTDLNPPVDF PADAKSVRDT 
MLCTCLVNEH DVRISTVEHL NAALAGLGID NIVIEVNAPE IPIMDGSAAP FVYLLLDAGI 
DELNCAKKFV RIKETVRVED GDKWAEFKPY NGFSLDFTID FNHPAIDSSN QRYAMNFSAD 
AFMRQISRAR TFGFMRDIEY LQSRGLCLGG SFDCAIVVDD YRVLNEDGLR FEDEFVRHKM 
LDAIGDLFMC GHNIIGAFTA YKSGHALNNK LLQAVLAKQE AWEYVTFQDD AELPLAFKAP 
SAVLA