Gene EcSMS35_2297 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2297
Symbol	mglB
ID	6143931
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	2325064
End bp	2326062
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	51%
IMG OID	641617171
Product	galactose ABC transporter, periplasmic galactose-binding protein
Protein accession	YP_001744344
Protein GI	170680313
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID	[TIGR01168] Gram-positive signal peptide, YSIRK family

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.897545
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.00310991
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAATAAGA AGGTGTTAAC CCTGTCTGCT GTGATGGCCA GCATGTTATT CGGTGCCGCT 
GCACACGCTG CTGATACTCG CATTGGTGTA ACAATCTATA AGTACGACGA TAACTTTATG 
TCTGTGGTGC GCAAGGCTAT TGAGCAAGAT GCGAAAGCCG CGCCAGATGT TCAGCTGCTG 
ATGAATGATT CTCAGAATGA CCAGTCCAAG CAGAACGATC AGATCGACGT ATTGCTGGCG 
AAAGGGGTGA AGGCACTGGC AATCAACCTG GTTGACCCGG CAGCTGCGGG TACGGTGATT 
GAGAAAGCGC GTGGGCAAAA CGTGCCGGTG GTTTTCTTCA ACAAAGAACC GTCTCGTAAG 
GCGCTGGATA GCTACGACAA AGCCTACTAC GTTGGCACTG ACTCCAAAGA GTCCGGCATT 
ATTCAGGGCG ATTTGATTGC TAAACACTGG GCGGCGAATC AGGGTTGGGA TCTGAACAAA 
GACGGTCAGA TTCAGTTCGT ACTGCTGAAA GGTGAGCCGG GCCATCCGGA TGCAGAAGCA 
CGTACCACTT ACGTGATTAA AGAATTGAAC GACAAAGGCA TCAAAACTGA ACAGTTACAG 
TTAGATACCG CTATGTGGGA TACCGCTCAG GCGAAAGATA AGATGGACGC CTGGCTATCT 
GGCCCGAACG CCAACAAAAT CGAAGTGGTT ATCGCCAACA ACGATGCGAT GGCAATGGGC 
GCGGTAGAAG CACTGAAAGC ACACAACAAG TCCAGCATTC CGGTGTTTGG CGTCGATGCG 
CTGCCAGAAG CGCTGGCGCT GGTGAAATCC GGTGCACTGG CGGGCACCGT ACTGAACGAT 
GCTAACAACC AGGCGAAAGC GACCTTTGAT TTGGCGAAAA ACCTGGCCGA TGGCAAAGGT 
GCGGCTGATG GCACCAACTG GAAAATCGAC AACAAAGTGG TCCGCGTACC TTATGTTGGC 
GTAGATAAAG ACAACCTGGC TGAATTCAGC AAGAAATAA

Protein sequence

MNKKVLTLSA VMASMLFGAA AHAADTRIGV TIYKYDDNFM SVVRKAIEQD AKAAPDVQLL 
MNDSQNDQSK QNDQIDVLLA KGVKALAINL VDPAAAGTVI EKARGQNVPV VFFNKEPSRK 
ALDSYDKAYY VGTDSKESGI IQGDLIAKHW AANQGWDLNK DGQIQFVLLK GEPGHPDAEA 
RTTYVIKELN DKGIKTEQLQ LDTAMWDTAQ AKDKMDAWLS GPNANKIEVV IANNDAMAMG 
AVEALKAHNK SSIPVFGVDA LPEALALVKS GALAGTVLND ANNQAKATFD LAKNLADGKG 
AADGTNWKID NKVVRVPYVG VDKDNLAEFS KK