Gene EcHS_A4618 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4618
Symbol	deoB
ID	5593926
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	4622614
End bp	4623837
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	54%
IMG OID	640923712
Product	phosphopentomutase
Protein accession	YP_001461149
Protein GI	157163831
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1015] Phosphopentomutase
TIGRFAM ID	[TIGR01696] phosphopentomutase

Plasmid Coverage information

Num covering plasmid clones	67
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACGTG CATTTATTAT GGTGCTGGAC TCATTCGGCA TCGGCGCTAC AGAAGATGCA 
GAACGCTTTG GTGACGTCGG GGCTGACACC CTGGGTCATA TCGCAGAAGC CTGTGCCAAA 
GGCGAAGCTG ATAACGGTCG TAAAGGCCCG CTCAATCTGC CAAATCTGAC CCGTCTGGGG 
CTGGCGAAAG CACATGAAGG TTCTACCGGT TTCATTCCGG CAGGAATGGA CGGCAACGCT 
GAAGTTATCG GCGCGTACGC ATGGGCGCAC GAAATGTCAT CCGGTAAAGA TACCCCGTCT 
GGTCACTGGG AAATCGCCGG TGTCCCGGTT CTGTTTGAGT GGGGATACTT CTCCGATCAC 
GAAAACAGCT TCCCGCAAGA GCTGCTGGAT AAACTGGTTG AACGCGCTAA CCTGCCTGGT 
TATCTCGGTA ACTGCCACTC TTCCGGTACG GTCATTCTGG ATCAGCTGGG CGAAGAGCAC 
ATGAAAACCG GCAAGCCGAT TTTCTATACC TCCGCTGACT CCGTGTTCCA GATTGCCTGC 
CACGAAGAAA CCTTTGGCTT GGATAAACTC TACGAACTGT GCGAAATCGC CCGTGAAGAG 
CTGACCAACG GCGGCTACAA CATCGGTCGT GTTATCGCTC GTCCGTTTAT TGGCGACAAA 
GCCGGTAACT TCCAGCGTAC CGGTAACCGT CACGACCTGG CTGTTGAGCC GCCAGCACCG 
ACCGTGCTGC AGAAACTGGT TGATGAAAAA CACGGTCAGG TGGTTTCTGT CGGTAAAATT 
GCAGACATCT ACGCCAACTG CGGTATCACC AAGAAAGTGA AAGCAACTGG CCTGGACGCG 
CTGTTTGACG CCACCATCAA AGAGATGAAA GAAGCGGGTG ATAACACCAT CGTCTTCACC 
AACTTCGTTG ACTTCGACTC TTCCTGGGGC CACCGTCGCG ACGTCGCCGG TTATGCTGCG 
GGTCTGGAGC TGTTCGACCG CCGTCTGCCG GAGCTGATGT CTTTGCTGCG CGATGACGAC 
ATCCTGATCC TCACTGCTGA CCACGGTTGT GATCCGACCT GGACCGGTAC TGACCACACG 
CGTGAACACA TTCCGGTACT GGTTTACGGC CCGAAAGTAA AACCGGGTTC ACTGGGTCAC 
CGTGAAACCT TCGCGGATAT CGGCCAGACT CTGGCAAAAT ATTTTGGTAC TTCTGATATG 
GAATATGGCA AAGCCATGTT CTGA

Protein sequence

MKRAFIMVLD SFGIGATEDA ERFGDVGADT LGHIAEACAK GEADNGRKGP LNLPNLTRLG 
LAKAHEGSTG FIPAGMDGNA EVIGAYAWAH EMSSGKDTPS GHWEIAGVPV LFEWGYFSDH 
ENSFPQELLD KLVERANLPG YLGNCHSSGT VILDQLGEEH MKTGKPIFYT SADSVFQIAC 
HEETFGLDKL YELCEIAREE LTNGGYNIGR VIARPFIGDK AGNFQRTGNR HDLAVEPPAP 
TVLQKLVDEK HGQVVSVGKI ADIYANCGIT KKVKATGLDA LFDATIKEMK EAGDNTIVFT 
NFVDFDSSWG HRRDVAGYAA GLELFDRRLP ELMSLLRDDD ILILTADHGC DPTWTGTDHT 
REHIPVLVYG PKVKPGSLGH RETFADIGQT LAKYFGTSDM EYGKAMF