Gene EcDH1_0531 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_0531
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	559694
End bp	561031
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	54%
IMG OID
Product	phosphoglucosamine mutase
Protein accession	ACX38219
Protein GI	260447797
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.0782231
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAATC GTAAATATTT CGGTACCGAT GGGATTCGTG GTCGTGTAGG GGATGCGCCG 
ATCACACCTG ATTTTGTGCT TAAGCTGGGT TGGGCCGCGG GTAAAGTGCT GGCGCGCCAC 
GGCTCCCGTA AGATTATTAT TGGTAAAGAC ACGCGTATTT CTGGCTATAT GCTGGAGTCA 
GCACTGGAAG CGGGTCTGGC GGCAGCGGGC CTTTCCGCAC TCTTCACTGG CCCGATGCCA 
ACACCGGCCG TGGCTTATCT GACGCGTACC TTCCGCGCAG AGGCCGGAAT TGTGATATCT 
GCATCGCATA ACCCGTTCTA CGATAATGGC ATTAAATTCT TCTCTATCGA CGGCACCAAA 
CTGCCGGATG CGGTAGAAGA GGCCATCGAA GCGGAAATGG AAAAGGAGAT CAGCTGCGTT 
GATTCGGCAG AACTGGGTAA AGCCAGCCGT ATCGTTGATG CCGCGGGTCG CTATATCGAG 
TTTTGCAAAG CCACGTTCCC GAACGAACTT AGCCTCAGTG AACTGAAGAT TGTGGTGGAT 
TGTGCAAACG GTGCGACTTA TCACATCGCG CCGAACGTGC TGCGCGAACT GGGGGCGAAC 
GTTATCGCTA TCGGTTGTGA GCCAAACGGT GTAAACATCA ATGCCGAAGT GGGGGCTACC 
GACGTTCGCG CGCTCCAGGC TCGTGTGCTG GCTGAAAAAG CGGATCTCGG TATTGCCTTC 
GACGGCGATG GCGATCGCGT GATTATGGTT GACCATGAAG GCAATAAAGT CGATGGCGAT 
CAGATCATGT ATATCATCGC GCGTGAAGGT CTTCGTCAGG GCCAGCTGCG TGGTGGCGCT 
GTGGGTACAT TGATGAGCAA CATGGGGCTT GAACTGGCGC TGAAACAGTT AGGAATTCCA 
TTTGCGCGCG CGAAAGTGGG TGACCGCTAC GTACTGGAAA AAATGCAGGA GAAAGGCTGG 
CGTATCGGTG CAGAGAATTC CGGTCATGTG ATCCTGCTGG ATAAAACTAC TACCGGTGAC 
GGCATCGTTG CTGGCTTGCA GGTGCTGGCG GCGATGGCAC GTAACCATAT GAGCCTGCAC 
GACCTTTGCA GCGGCATGAA AATGTTCCCG CAGATTCTGG TTAACGTACG TTACACCGCA 
GGTAGCGGCG ATCCACTTGA GCATGAGTCA GTTAAAGCCG TGACCGCAGA GGTTGAAGCT 
GCGCTGGGCA ACCGTGGACG CGTGTTGCTG CGTAAATCCG GCACCGAACC GTTAATTCGC 
GTGATGGTGG AAGGCGAAGA CGAAGCGCAG GTGACTGAAT TTGCACACCG CATCGCCGAT 
GCAGTAAAAG CCGTTTAA

Protein sequence

MSNRKYFGTD GIRGRVGDAP ITPDFVLKLG WAAGKVLARH GSRKIIIGKD TRISGYMLES 
ALEAGLAAAG LSALFTGPMP TPAVAYLTRT FRAEAGIVIS ASHNPFYDNG IKFFSIDGTK 
LPDAVEEAIE AEMEKEISCV DSAELGKASR IVDAAGRYIE FCKATFPNEL SLSELKIVVD 
CANGATYHIA PNVLRELGAN VIAIGCEPNG VNINAEVGAT DVRALQARVL AEKADLGIAF 
DGDGDRVIMV DHEGNKVDGD QIMYIIAREG LRQGQLRGGA VGTLMSNMGL ELALKQLGIP 
FARAKVGDRY VLEKMQEKGW RIGAENSGHV ILLDKTTTGD GIVAGLQVLA AMARNHMSLH 
DLCSGMKMFP QILVNVRYTA GSGDPLEHES VKAVTAEVEA ALGNRGRVLL RKSGTEPLIR 
VMVEGEDEAQ VTEFAHRIAD AVKAV