Gene EcSMS35_4932 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4932
Symbol	deoB
ID	6147067
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	5047533
End bp	5048756
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	54%
IMG OID	641619735
Product	phosphopentomutase
Protein accession	YP_001746839
Protein GI	170682473
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1015] Phosphopentomutase
TIGRFAM ID	[TIGR01696] phosphopentomutase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.912083
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACGTG CATTTATTAT GGTGCTGGAC TCATTCGGCA TCGGCGCTAC AGAAGATGCA 
GAACGCTTTG GTGACGTCGG GGCTGACACC CTGGGTCATA TCGCAGAAGC TTGTGCCAAA 
GGCGAAGCTG ATAACGGTCG TAAAGGCCCG CTCAATCTGC CAAATCTGAC CCGTCTGGGG 
CTGGCGAAAG CACACGAAGG TTCTACCGGT TTCATTCCGG CGGGAATGGA CGGCAACGCT 
GAAGTTATCG GCGCGTACGC ATGGGCGCAC GAAATGTCAT CCGGTAAAGA TACCCCGTCT 
GGTCACTGGG AAATCGCCGG TGTCCCGGTT CTGTTTGAGT GGGGATACTT CTCCGATCAC 
GAAAACAGCT TCCCGCAAGA GCTACTGGAT AAACTGGTCG AACGCGCTAA TCTGCCGGGT 
TACCTCGGTA ACTGCCACTC TTCCGGTACG GTCATTCTGG ATCAGCTGGG CGAAGAGCAC 
ATGAAAACCG GCAAGCCGAT TTTCTATACC TCCGCTGACT CCGTGTTCCA GATTGCCTGC 
CATGAAGAAA CTTTCGGTCT GGACAAACTC TACGAACTGT GCGAAATCGC TCGTGAAGAG 
CTGACCAACG GCGGCTACAA CATCGGTCGT GTTATCGCTC GTCCGTTTAT CGGCGACAAA 
GCCGGTAACT TCCAGCGTAC CGGTAACCGT CACGATCTGG CTGTTGAACC GCCAGCACCG 
ACCGTGCTGC AGAAACTGGT TGATGAAAAA CACGGCCAGG TGGTTTCTGT CGGTAAAATT 
GCGGACATCT ACGCTAACTG CGGCATCACC AAGAAAGTGA AAGCGACTGG CCTGGACGCG 
CTGTTTGACG CCACCATCAA AGAGATGAAA GAAGCGGGTG ATAACACTAT CGTCTTCACC 
AACTTCGTTG ACTTCGACTC TTCCTGGGGC CACCGTCGCG ACGTTGCCGG TTATGCTGCG 
GGTCTGGAGC TGTTCGACCG TCGTCTGCCG GAGCTGATGT CTCTGCTGCG CGATGACGAC 
ATCCTGATCC TCACCGCTGA CCACGGTTGT GATCCGACCT GGACCGGTAC TGACCACACG 
CGTGAACACA TTCCGGTACT GGTATACGGC CCGAAAGTAA AACCGGGCTC ACTGGGTCAC 
CGTGAAACCT TCGCGGATAT CGGCCAGACG CTGGCAAAAT ATTTTGGTAC TTCTGATATG 
GAATATGGCA AAGCCATGTT CTGA

Protein sequence

MKRAFIMVLD SFGIGATEDA ERFGDVGADT LGHIAEACAK GEADNGRKGP LNLPNLTRLG 
LAKAHEGSTG FIPAGMDGNA EVIGAYAWAH EMSSGKDTPS GHWEIAGVPV LFEWGYFSDH 
ENSFPQELLD KLVERANLPG YLGNCHSSGT VILDQLGEEH MKTGKPIFYT SADSVFQIAC 
HEETFGLDKL YELCEIAREE LTNGGYNIGR VIARPFIGDK AGNFQRTGNR HDLAVEPPAP 
TVLQKLVDEK HGQVVSVGKI ADIYANCGIT KKVKATGLDA LFDATIKEMK EAGDNTIVFT 
NFVDFDSSWG HRRDVAGYAA GLELFDRRLP ELMSLLRDDD ILILTADHGC DPTWTGTDHT 
REHIPVLVYG PKVKPGSLGH RETFADIGQT LAKYFGTSDM EYGKAMF