Gene ECH74115_5327 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5327
Symbol
ID	6967844
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	4970199
End bp	4971440
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	53%
IMG OID	643388988
Product	N-acylglucosamine 2-epimerase
Protein accession	YP_002273397
Protein GI	209400556
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2942] N-acyl-D-glucosamine 2-epimerase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	0.78432
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATGGT TTAACACTTT AAGTCACAAC CGTTGGCTGG AACAGGAAAC CGATCGCATC 
TTTGATTTTG GTAAAAATTC CGTAGTACCG ACCGGATTTG GCTGGTTAGG CAATAAAGGG 
CAAATCAAAG AAGAGATGGG CACCCATCTG TGGATCACAG CTCGTATGTT GCACGTTTAT 
TCCGTTGCTG CGGCGATGGG TCGACCTGGC GCTTACTCGT TGGTTGATCA CGGTATTAAA 
GCCATGAACG GCGCACTGCG CGATAAAAAA TATGGCGGCT GGTATGCCTG TGTGAATGAC 
GAGGGCGTGG TGGATGCCTC CAAACAGGGC TATCAACATT TCTTTGCTCT GCTGGGTGCT 
GCCAGCGCCG TCACAACGGG TCACCCGGAA GCGCGCAAGC TGCTCGATTA CACCATTGAA 
ATTATCGAGA AATACTTCTG GAGCGAAGAA GAGCAGATGT GCCTGGAGTC CTGGGACGAA 
GCCTTCAGCA AAACCGAAGA GTACCGCGGC GGCAATGCCA ATATGCACGC AGTGGAAGCT 
TTCTTAATTG TTTATGACGT AACGCATGAC AAAAAATGGC TGGATCGCGC GATTCGCGTG 
GCTTCCGTGA TTATCCACGA CGTCGCAAGA AATAATCATT ATCGCGTTAA CGAACACTTC 
GATACCCAGT GGAATCCGCT GCCGGATTAC AACAAAGATA ACCCGGCGCA CCGCTTCCGC 
GCGTTCGGAG GTACACCAGG CCACTGGATC GAATGGGGCC GTTTAATGCT GCACATCCAC 
GCGGCCCTGG AAGCCCGTTG CGAACAACCG CCAGCATGGC TGCTAGAAGA TGCCAAAGGT 
CTGTTTAACG CCACCGTGCG TGATGCCTGG GCACCCGATG GTGCGGACGG GATTGTTTAT 
ACCGTTGACT GGGAAGGAAA ACCGGTGGTC CGCGAACGTG TGCGTTGGCC TATCGTCGAA 
GCGATGGGTA CGGCCTACGC GCTCTACACC GTCACCGGCG ATCGCCAGTA CGAAACCTGG 
TATCAGACAT GGTGGGACTA CTGCATCAAA TACCTGATGG ACTACGAAAA TGGTTCATGG 
TGGCAGGAGC TGGATGCGGA CAATAAGGTC ACCACCAAAG TCTGGGACGG CAAACAGGAT 
ATTTATCACC TGCTGCATTG CCTGGTGATC CCGCGTATCC CGTTAGCGCC AGGCCTGGCT 
CCGGCAGTTG CGGCGGGTCT GCTGGATATT AACGCGAAAT AA

Protein sequence

MKWFNTLSHN RWLEQETDRI FDFGKNSVVP TGFGWLGNKG QIKEEMGTHL WITARMLHVY 
SVAAAMGRPG AYSLVDHGIK AMNGALRDKK YGGWYACVND EGVVDASKQG YQHFFALLGA 
ASAVTTGHPE ARKLLDYTIE IIEKYFWSEE EQMCLESWDE AFSKTEEYRG GNANMHAVEA 
FLIVYDVTHD KKWLDRAIRV ASVIIHDVAR NNHYRVNEHF DTQWNPLPDY NKDNPAHRFR 
AFGGTPGHWI EWGRLMLHIH AALEARCEQP PAWLLEDAKG LFNATVRDAW APDGADGIVY 
TVDWEGKPVV RERVRWPIVE AMGTAYALYT VTGDRQYETW YQTWWDYCIK YLMDYENGSW 
WQELDADNKV TTKVWDGKQD IYHLLHCLVI PRIPLAPGLA PAVAAGLLDI NAK