Gene B21_03550 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03550
Symbol	bglF
ID	8113050
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	3790600
End bp	3792477
Gene Length	1878 bp
Protein Length	625 aa
Translation table	11
GC content	52%
IMG OID	644849718
Product	hypothetical protein
Protein accession	YP_003001291
Protein GI	251786987
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1263] Phosphotransferase system IIC components, glucose/maltose/N-acetylglucosamine-specific
TIGRFAM ID	[TIGR00826] PTS system, glucose-like IIB component [TIGR00830] PTS system, glucose subfamily, IIA component [TIGR00852] PTS system, maltose and glucose-specific subfamily, IIC component [TIGR01995] PTS system, beta-glucoside-specific IIABC component

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGGAGT TAGCCAGAAA AATAGTCGCA GGAGTCGGGG GCGCAGATAA CATTGTGAGT 
CTGATGCATT GCGCAACGCG ATTACGTTTT AAGTTAAAGG ATGAAAGCAA AGCGCAAGCT 
GAGGTACTGA AAAAGACCCC CGGTATTATT ATGGTGGTGG AAAGCGGTGG TCAGTTTCAG 
GTGGTCATAG GTAACCATGT GGCCGATGTC TTCCTGGCGG TTAACAGCGT GGCAGGCCTT 
GGCGAAAAAG CGCAACAGGC ACCGGAAAAT GATGAGAAAG GTAATCTGCT AAACCGCTTT 
GTTTATGTTA TTTCAGGTAT TTTTACGCCT CTGATCGGTC TGATGGCGGC AACCGGGATC 
CTGAAAGGTA TGCTGGCTCT GGCGCTCACT TTTCAGTGGA CGACCGAACA AAGTGGTACT 
TATTTAATTT TATTCAGCGC CAGTGATGCC TTGTTTTGGT TCTTCCCGAT AATCCTGGGA 
TACACCGCGG GGAAACGCTT CGGCGGTAAT CCATTTACTG CCATGGTGAT TGGTGGAGCG 
TTAGTGCATC CATTAATTCT GACTGCTTTC GAGAACGGGC AAAAAGCGGA TGCGCTGGGG 
CTGGATTTCC TGGGTATTCC GGTCACATTG TTGAATTACT CGTCATCGGT TATTCCCATT 
ATTTTTTCTG CCTGGTTGTG CAGCATTCTG GAACGCCGAC TTAATGCGTG GTTACCGTCG 
GCAATCAAAA ATTTCTTCAC ACCATTGCTA TGTCTGATGG TTATCACACC CGTCACCTTT 
CTGTTGGTGG GGCCGCTATC AACCTGGATA AGCGAAATGA TTGCCGCCGG TTATCTCTGG 
CTTTATCAGG CGGTTCCTGC ATTTGCGGGC GCGGTAATGG GCGGCTTCTG GCAAATCTTC 
GTCATGTTCG GACTGCACTG GGGCCTGGTG CCGCTGTGTA TCAATAACTT CACCGTGCTG 
GGCTACGACA CCATGATCCC GCTGTTAATG CCCGCCATTA TGGCGCAGGT CGGGGCGGCG 
CTCGGCGTCT TCCTCTGCGA ACGCGATGCG CAGAAAAAAG TGGTAGCCGG ATCGGCGGCG 
TTGACGGGCC TGTTTGGTAT CACCGAACCA GCGGTATATG GCGTCAACCT GCCGCGTAAG 
TACCCCTTTG TTATCGCCTG TATCAGTGGG GCTTTGGGGG CCACCATCAT TGGCTACGCG 
CAAACAAAAG TTTACTCCTT TGGTTTGCCG AGTATTTTCA CCTTCATGCA GACCATCCCG 
TCAACGGGGA TTGATTTCAC CGTCTGGGCC AGCGTTATTG GCGGTGTCAT TGCCATCGGT 
TGCGCATTTG TCGGTACGGT GATGCTTCAT TTCATCACCG CTAAACGTCA GCCAGCGCAG 
GGTGCCCCGC AAGAGAAAAC ACCAGAGGTT ATTACACCAC CTGAGCAGGG CGGTATCTGT 
TCACCGATGA CGGGAGAGAT TGTGCCGCTC ATTCACGTCG CTGATACCAC GTTTGCCAGT 
GGCCTGTTGG GTAAAGGTAT CGCCATTCTG CCCTCGGTTG GTGAAGTGCG TTCTCCGGTT 
GCGGGTCGAA TTGCTTCGTT GTTCGCCACA TTACACGCCA TTGGCATTGA GTCAGATGAT 
GGTGTGGAGA TCCTGATTCA TGTCGGTATC GACACCGTAA AACTGGACGG CAAATTCTTT 
TCCGCTCACG TCAACGTGGG TGACAAGGTC AATACAGGCG ATCGGCTGAT TTCTTTTGAT 
ATCCCTGCTA TTCGCGAGGC CGGATTTGAT GTGACGACGC CGGTATTAAT CAGTAATAGC 
GATGATTTTA CAGACGTATT ACCCCACGGC ACGGCGCAGA TAAGCGCAGG TGAACCGCTG 
TTATCCATCA TTCGCTAA

Protein sequence

MTELARKIVA GVGGADNIVS LMHCATRLRF KLKDESKAQA EVLKKTPGII MVVESGGQFQ 
VVIGNHVADV FLAVNSVAGL GEKAQQAPEN DEKGNLLNRF VYVISGIFTP LIGLMAATGI 
LKGMLALALT FQWTTEQSGT YLILFSASDA LFWFFPIILG YTAGKRFGGN PFTAMVIGGA 
LVHPLILTAF ENGQKADALG LDFLGIPVTL LNYSSSVIPI IFSAWLCSIL ERRLNAWLPS 
AIKNFFTPLL CLMVITPVTF LLVGPLSTWI SEMIAAGYLW LYQAVPAFAG AVMGGFWQIF 
VMFGLHWGLV PLCINNFTVL GYDTMIPLLM PAIMAQVGAA LGVFLCERDA QKKVVAGSAA 
LTGLFGITEP AVYGVNLPRK YPFVIACISG ALGATIIGYA QTKVYSFGLP SIFTFMQTIP 
STGIDFTVWA SVIGGVIAIG CAFVGTVMLH FITAKRQPAQ GAPQEKTPEV ITPPEQGGIC 
SPMTGEIVPL IHVADTTFAS GLLGKGIAIL PSVGEVRSPV AGRIASLFAT LHAIGIESDD 
GVEILIHVGI DTVKLDGKFF SAHVNVGDKV NTGDRLISFD IPAIREAGFD VTTPVLISNS 
DDFTDVLPHG TAQISAGEPL LSIIR