Gene ECH74115_3283 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3283
Symbol	mglB
ID	6968903
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3015706
End bp	3016704
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	50%
IMG OID	643387096
Product	galactose ABC transporter, periplasmic galactose-binding protein
Protein accession	YP_002271560
Protein GI	209400859
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	0.69006
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAAGA AGGTGTTAAC CCTGTCTGCT GTGATGGCCA GCATGTTATT CGGTGCCACT 
GCACACGCTG CTGATACTCG CATTGGTGTA ACAATCTATA AGTACGACGA TAACTTTATG 
TCTGTAGTGC GCAAGGCTAT TGAGCAAGAT GCGAAAGCCG CGCCAGATGT TCAGCTGCTG 
ATGAATGATT CACAGAATGA CCAGTCCAAG CAGAACGATC AGATCGACGT ATTGCTGGCG 
AAAGGGGTGA AGGCACTGGC AATCAACCTG GTTGACCCGG CAGCTGCGGG TACGGTGATT 
GAGAAAGCGC GTGGGCAAAA TGTGCCGGTG GTATTCTTTA ACAAAGAACC GTCTCGTAAG 
GCGCTGGATA GCTACGACAA AGCCTACTAC GTTGGCACTG ACTCCAAAGA GTCCGGCATT 
ATTCAAGGCG ATTTGATTGC TAAACACTGG GCGGCGAATC AGGGTTGGGA TCTGAATAAA 
GACGGTCAGA TTCAATTCGT ACTGCTGAAA GGTGAACCGG GCCATCCGGA TGCAGAAGCA 
CGTACCACTT ACGTGATTAA AGAGCTGAAC GACAAAGGCA TTAAAACTGA ACAGTTACAG 
TTAGATACCG CTATGTGGGA TACCGCTCAG GCGAAAGATA AGATGGACGC CTGGCTGTCT 
GGCCCGAACG CCAACAAAAT CGAAGTGGTT ATCGCCAACA ACGATGCGAT GGCAATGGGC 
GCGGTAGAAG CACTGAAAGC ACACAACAAG TCCAGCATTC CGGTGTTTGG CGTCGATGCT 
CTGCCAGAAG CGCTGGCGCT GGTGAAATCC GGTGCACTGG CGGGCACCGT ACTGAACGAT 
GCTAACAACC AGGCGAAAGC GACCTTTGAT CTGGCGAAAA ACCTGGCCGA TGGTAAAGGT 
GCGGCTGATG GCACCAACTG GAAAATCGAC AACAAAGTGG TCCGCGTACC TTATGTTGGC 
GTAGATAAAG ACAACCTGGC TGAATTCAGC AAGAAATAA

Protein sequence

MNKKVLTLSA VMASMLFGAT AHAADTRIGV TIYKYDDNFM SVVRKAIEQD AKAAPDVQLL 
MNDSQNDQSK QNDQIDVLLA KGVKALAINL VDPAAAGTVI EKARGQNVPV VFFNKEPSRK 
ALDSYDKAYY VGTDSKESGI IQGDLIAKHW AANQGWDLNK DGQIQFVLLK GEPGHPDAEA 
RTTYVIKELN DKGIKTEQLQ LDTAMWDTAQ AKDKMDAWLS GPNANKIEVV IANNDAMAMG 
AVEALKAHNK SSIPVFGVDA LPEALALVKS GALAGTVLND ANNQAKATFD LAKNLADGKG 
AADGTNWKID NKVVRVPYVG VDKDNLAEFS KK