Gene EcE24377A_2445 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_2445
Symbol	mglB
ID	5589862
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	2427689
End bp	2428687
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	51%
IMG OID	640926106
Product	galactose ABC transporter, periplasmic galactose-binding protein
Protein accession	YP_001463501
Protein GI	157157007
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID	[TIGR01168] Gram-positive signal peptide, YSIRK family

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAAGA AGGTGTTAAC CCTGTCTGCT GTGATGGCCA GCATGTTATT CGGTGCCGCT 
GCACACGCTG CTGATACTCG CATTGGTGTA ACAATCTATA AGTACGACGA TAACTTTATG 
TCTGTAGTGC GCAAGGCTAT TGAGCAAGAT GCGAAAGCCG CGCCAGATGT TCAGCTGCTG 
ATGAATGATT CTCAGAATGA CCAGTCCAAG CAGAACGATC AGATCGACGT ATTGCTGGCG 
AAAGGGGTGA AGGCACTGGC AATCAACCTG GTTGACCCGG CAGCTGCGGG TACGGTGATT 
GAGAAAGCGC GTGGGCAAAA CGTGCCGGTG GTTTTCTTCA ACAAAGAACC GTCTCGTAAG 
GCGCTGGATA GCTACGACAA AGCCTACTAC GTTGGCACTG ATTCCAAAGA GTCCGGCATT 
ATTCAGGGCG ATTTGATTGC TAAACACTGG GCGGCGAATC AGGGTTGGGA TCTGAATAAA 
GATGGTCAGA TTCAGTTCGT ACTGCTGAAA GGTGAACCGG GCCATCCGGA TGCAGAAGCA 
CGTACCACTT ACGTGATTAA AGAATTGAAC GACAAAGGCA TCAAAACTGA ACAGTTACAG 
TTAGATACCG CTATGTGGGA CACCGCTCAG GCGAAAGATA AGATGGACGC CTGGCTGTCT 
GGCCCGAACG CCAACAAAAT CGAAGTGGTT ATTGCTAACA ACGATGCGAT GGCAATGGGT 
GCGGTTGAAG CGCTGAAAGC ACACAACAAG TCCAGCATTC CGGTGTTTGG CGTCGATGCG 
CTGCCAGAAG CTCTGGCGCT GGTGAAATCC GGTGCACTGG CGGGCACCGT ACTGAACGAT 
GCTAACAACC AGGCGAAAGC GACCTTTGAT CTGGCGAAAA ATCTGGCCGA TGGCAAAGGT 
GCGGCTGATG GCACCAACTG GAAAATCGAC AACAAAGTGG TCCGCGTACC TTATGTTGGC 
GTAGATAAAG ACAACCTGGC TGAATTCAGC AAGAAATAA

Protein sequence

MNKKVLTLSA VMASMLFGAA AHAADTRIGV TIYKYDDNFM SVVRKAIEQD AKAAPDVQLL 
MNDSQNDQSK QNDQIDVLLA KGVKALAINL VDPAAAGTVI EKARGQNVPV VFFNKEPSRK 
ALDSYDKAYY VGTDSKESGI IQGDLIAKHW AANQGWDLNK DGQIQFVLLK GEPGHPDAEA 
RTTYVIKELN DKGIKTEQLQ LDTAMWDTAQ AKDKMDAWLS GPNANKIEVV IANNDAMAMG 
AVEALKAHNK SSIPVFGVDA LPEALALVKS GALAGTVLND ANNQAKATFD LAKNLADGKG 
AADGTNWKID NKVVRVPYVG VDKDNLAEFS KK