Gene ECH74115_0104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0104
Symbol	lpxC
ID	6967167
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	111143
End bp	112060
Gene Length	918 bp
Protein Length	305 aa
Translation table	11
GC content	51%
IMG OID	643384181
Product	UDP-3-O-[3-hydroxymyristoyl] N-acetylglucosamine deacetylase
Protein accession	YP_002268704
Protein GI	209397750
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0774] UDP-3-O-acyl-N-acetylglucosamine deacetylase
TIGRFAM ID	[TIGR00325] UDP-3-0-acyl N-acetylglucosamine deacetylase

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000975271
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	64
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCAAAC AAAGGACACT TAAACGTATC GTTCAGGCGA CGGGTGTCGG TTTACATACC 
GGCAAGAAAG TCACCCTGAC GTTACGCCCT GCGCCGGCCA ACACCGGGGT CATCTATCGT 
CGCACCGACT TGAATCCACC GGTAGATTTC CCGGCCGATG CCAAATCTGT GCGTGATACC 
ATGCTCTGTA CGTGTCTGGT CAACGAGCAT GATGTACGGA TTTCAACCGT AGAGCACCTC 
AATGCTGCTC TCGCGGGCTT GGGCATCGAT AACATTGTTA TCGAAGTTAA CGCGCCGGAA 
ATCCCGATCA TGGACGGCAG CGCCGCTCCG TTTGTATACC TGCTGCTTGA CGCCGGTATC 
GACGAGTTGA ACTGCGCCAA AAAATTTGTT CGCATCAAAG AGACTGTTCG TGTCGAAGAT 
GGCGATAAGT GGGCTGAATT TAAGCCGTAC AATGGTTTTT CGCTGGATTT CACCATCGAT 
TTTAACCATC CGGCTATTGA TTCCAGCAAC CAGCGCTATG CGATGAACTT CTCCGCTGAT 
GCGTTTATGC GCCAGATCAG CCGTGCGCGT ACGTTCGGTT TCATGCGTGA TATCGAATAT 
CTGCAGTCCC GTGGTTTGTG CCTGGGCGGC AGCTTCGATT GTGCCATCGT TGTTGACGAT 
TATCGCGTAC TGAACGAAGA CGGCCTGCGT TTTGAAGACG AATTTGTGCG TCACAAAATG 
CTCGATGCGA TCGGTGACTT GTTCATGTGT GGTCACAATA TTATTGGTGC ATTTACCGCT 
TATAAATCCG GTCATGCACT GAATAACAAA CTGCTGCAGG CTGTCCTGGC GAAACAGGAA 
GCCTGGGAAT ATGTGACCTT CCAGGACGAC GCAGAACTGC CGTTGGCCTT CAAAGCGCCT 
TCAGCCGTAC TGGCATAA

Protein sequence

MIKQRTLKRI VQATGVGLHT GKKVTLTLRP APANTGVIYR RTDLNPPVDF PADAKSVRDT 
MLCTCLVNEH DVRISTVEHL NAALAGLGID NIVIEVNAPE IPIMDGSAAP FVYLLLDAGI 
DELNCAKKFV RIKETVRVED GDKWAEFKPY NGFSLDFTID FNHPAIDSSN QRYAMNFSAD 
AFMRQISRAR TFGFMRDIEY LQSRGLCLGG SFDCAIVVDD YRVLNEDGLR FEDEFVRHKM 
LDAIGDLFMC GHNIIGAFTA YKSGHALNNK LLQAVLAKQE AWEYVTFQDD AELPLAFKAP 
SAVLA