Gene EcE24377A_4231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_4231
Symbol	bglF
ID	5586356
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	4220489
End bp	4222366
Gene Length	1878 bp
Protein Length	625 aa
Translation table	11
GC content	52%
IMG OID	640927847
Product	PTS system beta-glucoside-specific transporter subunits IIABC
Protein accession	YP_001465206
Protein GI	157157352
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1263] Phosphotransferase system IIC components, glucose/maltose/N-acetylglucosamine-specific [COG2190] Phosphotransferase system IIA components
TIGRFAM ID	[TIGR00826] PTS system, glucose-like IIB component [TIGR00830] PTS system, glucose subfamily, IIA component [TIGR00852] PTS system, maltose and glucose-specific subfamily, IIC component [TIGR01995] PTS system, beta-glucoside-specific IIABC component

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGGAGT TAGCCAGAAA AATAGTCGCA GGAGTCGGGG GCGCAGATAA CATTGTGAGT 
CTGATGCATT GCGCAACGCG ATTACGTTTT AAGTTAAAGG ATGAAAGCAA AGCGCAAGCT 
GAGGTACTGA AAAACACCCC CGGTATTATT ATGGTGGTGG AAAGCGGTGG CCAGTTTCAG 
GTGGTCATAG GTAACCATGT GGCCGATGTC TTCCTGGCGG TCAACAGCGT GGCAGGCCTT 
GGCGAAAAAG CGCAACAGGC ACCGGAAAAT GATGAGAAAG GTAATCTGCT AAACCGCTTT 
GTTTATGTTA TTTCAGGTAT TTTTACGCCT CTGATCGGTT TGATGGCGGC AACCGGGATC 
CTGAAAGGTA TGCTGGCTCT GGCGCTCACT TTTCAGTGGA CGACCGAACA AAGTGGTACT 
TATTTAATTT TATTCAGCGC CAGTGATGCC TTGTTTTGGT TCTTCCCGAT AATCCTGGGA 
TACACCGCGG GGAAACGCTT CGGCGGTAAT CCATTTACTG CCATGGTGAT TGGTGGAGCG 
TTAGTGCATC CATTAATTCT GACTGCTTTC GAGAACGGGC AAAAAGCGGA TGAGCTGGGG 
CTGGATTTCC TGGGTATTCC GGTCACATTG TTGAATTACT CGTCATCGGT TATTCCCATT 
ATTTTTTCTG CCTGGTTGTG CAGCATTCTG GAACGCCGAC TTAATGCGTG GTTACCGTCG 
GCAATCAAAA ATTTCTTCAC ACCATTGCTA TGTCTGATGG TTATCACACC CGTCACCTTT 
CTGCTGGTGG GGCCGCTATC AACCTGGATA AGCGAACTGA TTGCCGCCGG TTATCTCTGG 
CTTTATCAGG CAGTTCCTGC ATTTGCGGGC GCGGTAATGG GCGGCTTCTG GCAAATCTTC 
GTCATGTTCG GACTGCACTG GGGCCTGGTG CCGCTGTGTA TCAATAACTT CACCGTGCTG 
GGCTACGACA CCATGATCCC GCTGTTAATG CCCGCCATTA TGGCGCAGGT CGGGGCGGCG 
CTCGGCGTCT TCCTCTGCGA ACGCGATGCG CAGAAAAAAG TGGTGGCGGG ATCAGCGGCG 
TTGACGGGCC TGTTTGGTAT CACCGAACCA GCGGTATATG GCGTCAACCT GCCGCGTAAG 
TATCCCTTCG TTATCGCCTG TATCAGTGGA GCATTGGGGG CCACCATCAT TGGCTACGCG 
CAAACGAAAG TTTACTCCTT TGGTTTGCCA AGTATTTTCA CCTTCATGCA AACCATCCCG 
TCAACGGGGA TTGATTTCAC CGTCTGGGCC AGCGTTATTG GCGGTGTCAT TGCCATCGGT 
TGCGCATTTG TCGGTACGGT GATGCTTCAT TTCATCACCG CTAAACGTCA GCCAGCGCAG 
GGTGCCCCGC AAGAGAAAAC ACCAGAGGTT ATTACACCAC CTGAGCAGGG CGGTATCTGT 
TCACCGATGA CGGGAGAGAT TGTGCCGCTC ATTCACGTCG CTGATACCAC GTTTGCCAGT 
GGCCTGTTGG GTAAAGGTAT CGCCATTCTG CCCTCGGTTG GTGAAGTGCG TTCTCCGGTT 
GCGGGTCGAA TTGCTTCGTT GTTCGCCACA TTACACGCCA TTGGCATTGA GTCAGATGAT 
GGTGTGGAGC TCCTGATTCA TGTCGGTATC GACACCGTAA AACTGGACGG CAAATTCTTT 
TCCGCTCACG TCAACGTGGG TGACAAGGTC AATACAGGCG ATCGGCTGAT TTCTTTTGAT 
ATCCCTGCTA TTCGCGAGGC CGGATTTGAT CTGACGACGC CGGTATTAAT CAGTAATAGC 
GATGATTTTA CGGACGTATT ACCCCACGGC ACGGCGCAGA TAAGCGCAGG TGAACCGCTG 
TTATCCATCA TTCGCTAA

Protein sequence

MTELARKIVA GVGGADNIVS LMHCATRLRF KLKDESKAQA EVLKNTPGII MVVESGGQFQ 
VVIGNHVADV FLAVNSVAGL GEKAQQAPEN DEKGNLLNRF VYVISGIFTP LIGLMAATGI 
LKGMLALALT FQWTTEQSGT YLILFSASDA LFWFFPIILG YTAGKRFGGN PFTAMVIGGA 
LVHPLILTAF ENGQKADELG LDFLGIPVTL LNYSSSVIPI IFSAWLCSIL ERRLNAWLPS 
AIKNFFTPLL CLMVITPVTF LLVGPLSTWI SELIAAGYLW LYQAVPAFAG AVMGGFWQIF 
VMFGLHWGLV PLCINNFTVL GYDTMIPLLM PAIMAQVGAA LGVFLCERDA QKKVVAGSAA 
LTGLFGITEP AVYGVNLPRK YPFVIACISG ALGATIIGYA QTKVYSFGLP SIFTFMQTIP 
STGIDFTVWA SVIGGVIAIG CAFVGTVMLH FITAKRQPAQ GAPQEKTPEV ITPPEQGGIC 
SPMTGEIVPL IHVADTTFAS GLLGKGIAIL PSVGEVRSPV AGRIASLFAT LHAIGIESDD 
GVELLIHVGI DTVKLDGKFF SAHVNVGDKV NTGDRLISFD IPAIREAGFD LTTPVLISNS 
DDFTDVLPHG TAQISAGEPL LSIIR