Gene ECH74115_5224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5224
Symbol	wecE
ID	6971312
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	4871648
End bp	4872778
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	55%
IMG OID	643388889
Product	TDP-4-oxo-6-deoxy-D-glucose transaminase
Protein accession	YP_002273309
Protein GI	209400869
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0399] Predicted pyridoxal phosphate-dependent enzyme apparently involved in regulation of cell wall biogenesis
TIGRFAM ID	[TIGR02379] TDP-4-keto-6-deoxy-D-glucose transaminase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.744835
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	70
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTCCAT TTAACGCACC GCCGGTGGTG GGAACCGAAC TCGACTATAT GCAGTCGGCA 
ATGGGTAGCG GCAAACTGTG TGGCGATGGC GGTTTTACCC GTCGCTGCCA GCAGTGGCTG 
GAGCAACGTT TTGGCAGCGC CAAAGTGTTA CTGACGCCGT CCTGCACCGC TTCGCTGGAG 
ATGGCGGCGC TGCTGCTCGA TATCCAGCCT GGCGATGAAG TGATCATGCC GAGCTACACC 
TTTGTCTCCA CCGCCAATGC CTTTGTGCTG CGTGGCGCAA AAATCGTTTT TGTGGATGTT 
CGCCCGGACA CCATGAACAT CGACGAAACG TTGATTGAAG CGGCGATCAC CGACAAAACG 
CGCGTTATCG TGCCGGTGCA TTACGCGGGC GTGGCCTGCG AAATGGACAC CATTATGGCG 
TTGGCGAAAA AGCATAATCT GTTTGTGGTG GAAGATGCTG CTCAGGGCGT GATGTCCACT 
TACAAAGGGC GTGCACTGGG AACCATTGGT CATATTGGCT GCTTTAGCTT CCATGAAACC 
AAAAACTACA CGGCGGGCGG TGAAGGCGGC GCGACGCTGA TTAACGATAA AGCGTTGATC 
GAACGAGCCG AGATCATCCG TGAAAAAGGC ACAAACCGCA GCCAGTTCTT CCGTGGTCAG 
GTCGATAAAT ATACCTGGCG CGATATCGGC TCCAGCTATT TGATGTCCGA TCTGCAAGCT 
GCGTACCTGT GGGCGCAACT GGAAGCAGCG GATCGTATCA ACCAGCAACG TCTGGCGCTG 
TGGCAAAACT ACTACGATGC GTTAGCACCT CTGGCGAAAG CCGGGCGTAT CGAGCTGCCG 
TCGATTCCCG ATGGCTGCTT GCAGAACGCG CATATGTTTT ACATTAAACT GCGGGATATT 
GGTGACCGGA GCGCGTTGAT TAACTTTCTG AAAGAAGCGG AAATCATGGC GGTGTTCCAT 
TACATTCCGC TGCACGGTTG CCCTGCGGGG GAACGCTTTG GTGAGTTCCA CGGTGAAGAT 
CGCTACACCA CCAAAGAGAG CGAGCGCCTG CTGCGCCTGC CGCTGTTCTA CAACCTGTCG 
CCCGTCAATC AGCGTACGGT AATTGCGACT TTGTTGAACT ACTTCTCCTG A

Protein sequence

MIPFNAPPVV GTELDYMQSA MGSGKLCGDG GFTRRCQQWL EQRFGSAKVL LTPSCTASLE 
MAALLLDIQP GDEVIMPSYT FVSTANAFVL RGAKIVFVDV RPDTMNIDET LIEAAITDKT 
RVIVPVHYAG VACEMDTIMA LAKKHNLFVV EDAAQGVMST YKGRALGTIG HIGCFSFHET 
KNYTAGGEGG ATLINDKALI ERAEIIREKG TNRSQFFRGQ VDKYTWRDIG SSYLMSDLQA 
AYLWAQLEAA DRINQQRLAL WQNYYDALAP LAKAGRIELP SIPDGCLQNA HMFYIKLRDI 
GDRSALINFL KEAEIMAVFH YIPLHGCPAG ERFGEFHGED RYTTKESERL LRLPLFYNLS 
PVNQRTVIAT LLNYFS