Gene EcHS_A0810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0810
Symbol	galM
ID	5593699
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	814399
End bp	815439
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	56%
IMG OID	640919982
Product	aldose 1-epimerase
Protein accession	YP_001457549
Protein GI	157160231
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2017] Galactose mutarotase and related enzymes
TIGRFAM ID	[TIGR02636] galactose mutarotase

Plasmid Coverage information

Num covering plasmid clones	51
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTGAACG AAACTCCCGC ACTGGCACCC GATGGTCAGC CGTACCGACT GTTAACTTTG 
CGTAACAACG CAGGGATGGT AGTCACGCTG ATGGACTGGG GTGCGACTTT ACTTTCAGCC 
CGTATTCCGC TTTCCGATGG CAGCGTCCGC GAGGCGCTGC TCGGCTGTGC CAGCCCGGAA 
TGCTATCAGG ATCAGGCCGC GTTTCTGGGG GCCTCTATTG GTCGTTATGC CAACCGTATC 
GCCAATAGCC GTTATACCTT TGACGGTGAA ACCGTGACCC TTTCGCCAAG TCAGGGCGTT 
AACCAGCTGC ACGGCGGCCC GGAAGGGTTC GACAAACGTC GCTGGCAGAT TGTGAACCAG 
AACGATCGTC AGGTGCTGTT TGCCCTGAGT TCAGATGATG GCGATCAGGG CTTCCCGGGT 
AATCTCGGCG CAACGGTGCA ATATCGTCTG ACCGACGATA ACCGTATCTC CATTACTTAT 
CGCGCCACAG TTGATAAACC TTGCCCGGTG AATATGACTA ATCACGTCTA TTTCAATCTT 
GACGGCGAGC AGTCTGACGT GCGCAATCAC AAGTTGCAGA TTCTGGCGGA CGAATATCTG 
CCGGTTGATG AAGGCGGCAT TCCGCACGAC GGCCTGAAAT CTGTCGCCGG AACGTCTTTT 
GATTTCCGCA GCGCCAAAAT CATCGCCAGT GAGTTTCTTG CCGACGACGA TCAGCGCAAA 
GTGAAAGGTT ACGATCACGC ATTCTTGTTA CAGGCCAAAG GCGATGGCAA GAAAGTGGCG 
GCGCATGTCT GGTCAGCAGA TGAAAAATTG CAGCTGAAGG TCTACACCAC CGCTCCGGCT 
CTTCAATTCT ACTCCGGCAA CTTCCTCGGC GGCACACCGT CGCGGGGAAC CGAACCTTAC 
GCCGACTGGC AAGGGCTGGC GTTGGAAAGC GAGTTTCTGC CGGACAGCCC GAACCACCCT 
GAATGGCCGC AACCGGACTG CTTCCTGCGT CCTGGCGAAG AGTATTCCAG CCTGACGGAA 
TATCAGTTTA TTGCTGAGTA A

Protein sequence

MLNETPALAP DGQPYRLLTL RNNAGMVVTL MDWGATLLSA RIPLSDGSVR EALLGCASPE 
CYQDQAAFLG ASIGRYANRI ANSRYTFDGE TVTLSPSQGV NQLHGGPEGF DKRRWQIVNQ 
NDRQVLFALS SDDGDQGFPG NLGATVQYRL TDDNRISITY RATVDKPCPV NMTNHVYFNL 
DGEQSDVRNH KLQILADEYL PVDEGGIPHD GLKSVAGTSF DFRSAKIIAS EFLADDDQRK 
VKGYDHAFLL QAKGDGKKVA AHVWSADEKL QLKVYTTAPA LQFYSGNFLG GTPSRGTEPY 
ADWQGLALES EFLPDSPNHP EWPQPDCFLR PGEEYSSLTE YQFIAE