Gene ECH74115_5898 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5898
Symbol	deoB
ID	6969774
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	5551069
End bp	5552292
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	54%
IMG OID	643389513
Product	phosphopentomutase
Protein accession	YP_002273904
Protein GI	209399462
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1015] Phosphopentomutase
TIGRFAM ID	[TIGR01696] phosphopentomutase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACGTG CATTTATTAT GGTGCTGGAC TCATTCGGCA TCGGCGCTAC AGAAGATGCA 
GAACGCTTTG GTGACGTCGG GGCTGACACC CTGGGTCATA TCGCAGAAGC TTGTGCCAAA 
GGCGAAGCTG ATAACGGTCG TAAAGGCCCG CTCAATCTGC CAAATCTGAC CCGTCTGGGG 
CTGGCGAAAG CACACGAAGG TTCTACCGGT TTCATTCCGG CGGGAATGGA CGGCAACGCT 
GAAGTTATCG GCGCGTACGC ATGGGCGCAC GAAATGTCAT CCGGTAAAGA TACCCCGTCT 
GGTCACTGGG AAATTGCCGG TGTCCCGGTT CTGTTTGAGT GGGGATATTT CTCCGATCAC 
GAAAACAGCT TCCCGCAAGA GCTGCTGGAT AAACTGGTCG AACGCGCTAA TCTGCCGGGT 
TACCTCGGTA ACTGCCACTC TTCCGGTACG GTCATTCTGG ATCAACTGGG CGAAGAGCAC 
ATGAAAACCG GCAAGCCGAT TTTCTATACC TCCGCTGACT CCGTGTTCCA GATTGCCTGC 
CATGAAGAAA CTTTCGGTCT GGATAAACTC TACGAACTGT GCGAAATCGC CCGTGAAGAG 
CTGACCAACG GCGGCTACAA TATCGGTCGT GTTATCGCTC GTCCGTTTAT CGGCGACAAA 
GCCGGTAACT TCCAGCGTAC CGGTAACCGT CACGACCTGG CTGTTGAGCC GCCAGCACCG 
ACCGTGCTGC AGAAACTGGT TGATGAAAAA CACGGCCAGG TGGTTTCGGT CGGTAAAATT 
GCAGACATCT ACGCCAACTG CGGTATCACC AAAAAAGTGA AAGCGACTGG CCTGGACGCG 
CTGTTTGACG CCACCATCAA AGAGATGAAA GAAGCGGGTG ATAACACCAT CGTCTTCACC 
AACTTCGTTG ACTTCGACTC TTCCTGGGGC CACCGTCGCG ACGTCGCCGG TTATGCTGCG 
GGTCTGGAAC TGTTCGACCG CCGTCTGCCG GAGCTGATGT CTCTGCTGCG CGATGACGAC 
ATCCTGATCC TCACCGCTGA CCACGGCTGT GATCCGACCT GGACCGGTAC TGACCACACG 
CGTGAACACA TTCCGGTACT GGTTTACGGC CCGAAAGTAA AACCGGGCTC ACTGGGTCAC 
CGTGAAACCT TCGCGGATAT CGGCCAGACT CTGGCAAAAT ATTTTGGTAC TTCTGATATG 
GAATATGGCA AAGCCATGTT CTGA

Protein sequence

MKRAFIMVLD SFGIGATEDA ERFGDVGADT LGHIAEACAK GEADNGRKGP LNLPNLTRLG 
LAKAHEGSTG FIPAGMDGNA EVIGAYAWAH EMSSGKDTPS GHWEIAGVPV LFEWGYFSDH 
ENSFPQELLD KLVERANLPG YLGNCHSSGT VILDQLGEEH MKTGKPIFYT SADSVFQIAC 
HEETFGLDKL YELCEIAREE LTNGGYNIGR VIARPFIGDK AGNFQRTGNR HDLAVEPPAP 
TVLQKLVDEK HGQVVSVGKI ADIYANCGIT KKVKATGLDA LFDATIKEMK EAGDNTIVFT 
NFVDFDSSWG HRRDVAGYAA GLELFDRRLP ELMSLLRDDD ILILTADHGC DPTWTGTDHT 
REHIPVLVYG PKVKPGSLGH RETFADIGQT LAKYFGTSDM EYGKAMF