Gene EcE24377A_3228 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_3228
Symbol	bglA
ID	5588940
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	3247004
End bp	3248443
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	51%
IMG OID	640926867
Product	6-phospho-beta-glucosidase BglA
Protein accession	YP_001464239
Protein GI	157155838
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAGTGA AAAAACTCAC CTTACCGAAA GATTTCTTAT GGGGCGGCGC AGTTGCCGCT 
CATCAGGTCG AAGGCGGCTG GAACAAAGGC GGCAAAGGGC CGAGCATTTG TGACGTTCTG 
ACCGGTGGCG CACACGGCGT GCCGCGCGAA ATCACCAAAG AAGTCTTGCC AGGCAAATAC 
TATCCAAACC ATGAAGCCGT TGATTTTTAT GGTCACTACA AGGAAGACAT CAAGCTATTT 
GCCGAAATGG GCTTCAAATG TTTTCGGACT TCCATCGCCT GGACGCGTAT TTTTCCAAAA 
GGTGATGAAG CTCAGCCAAA CGAAGAAGGG CTGAAGTTCT ACGATGATAT GTTCGATGAA 
CTGCTGAAAT ACAACATCGA ACCGGTGATC ACCCTCTCCC ACTTTGAAAT GCCGCTGCAT 
CTGGTGCAGC AATACGGTAG CTGGACCAAC CGTAAAGTGG TTGATTTCTT TGTCCGTTTC 
GCGGAAGTGG TGTTTGAACG CTATAAGCAT AAAGTCAAAT ACTGGATGAC CTTCAACGAA 
ATTAACAACC AGCGTAACTG GCGTGCACCG CTGTTCGGTT ACTGCTGCTC CGGCGTGGTT 
TATACCGAGC ATGAGAACCC GGAAGAGACG ATGTATCAGG TGCTGCATCA CCAGTTTGTC 
GCCAGCGCCC TGGCGGTGAA AGCTGCGCGT CGCATTAACC CGGAGATGAA AGTCGGCTGT 
ATGCTGGCGA TGGTGCCGCT CTATCCCTAC TGCTGTAACC CGGACGATGT GATGTTCGCT 
CAGGAGTCGA TGCGCGAACG CTACGTCTTT ACCGATGTGC AGCTACGCGG CTATTACCCG 
TCCTATGTGT TGAACGAGTG GGAGCGTCGC GGATTTAACA TCAAAATGGA AGACGGCGAT 
CTCGATGTAC TGCGTGAAGG CACCTGCGAT TATCTTGGTT TCAGCTATTA CATGACCAAC 
GCAGTGAAGG CCGAAGGCGG CACCGGCGAT GCGATCTCTG GTTTTGAAGG CAGCGTACCG 
AACCCGTATG TTAAAGCGTC TGACTGGGGC TGGCAGATTG ATCCAGTAGG TCTGCGCTAT 
GCCCTTTGCG AACTGTATGA GCGTTATCAG AGGCCGCTGT TTATTGTCGA AAACGGTTTT 
GGCGCTTACG ACAAAGTGGA AGAAGATGGC AGCATCAACG ACGACTACCG CATTGACTAC 
CTGCGCGCCC ATATTGAAGA GATGAAAAAA GCAGTGACTT ACGATGGTGT GGATCTGATG 
GGTTACACAC CGTGGGGCTG CATCGACTGC GTGTCATTCA CTACCGGGCA GTACAGCAAA 
CGCTACGGCT TTATCTATGT GAATAAACAT GACGACGGTA CTGGCGATAT GTCGCGTTCA 
CGTAAGAAGA GCTTTAACTG GTACAAAGAG GTGATTGCCA GCAACGGCGA GAAGCTTTAA

Protein sequence

MIVKKLTLPK DFLWGGAVAA HQVEGGWNKG GKGPSICDVL TGGAHGVPRE ITKEVLPGKY 
YPNHEAVDFY GHYKEDIKLF AEMGFKCFRT SIAWTRIFPK GDEAQPNEEG LKFYDDMFDE 
LLKYNIEPVI TLSHFEMPLH LVQQYGSWTN RKVVDFFVRF AEVVFERYKH KVKYWMTFNE 
INNQRNWRAP LFGYCCSGVV YTEHENPEET MYQVLHHQFV ASALAVKAAR RINPEMKVGC 
MLAMVPLYPY CCNPDDVMFA QESMRERYVF TDVQLRGYYP SYVLNEWERR GFNIKMEDGD 
LDVLREGTCD YLGFSYYMTN AVKAEGGTGD AISGFEGSVP NPYVKASDWG WQIDPVGLRY 
ALCELYERYQ RPLFIVENGF GAYDKVEEDG SINDDYRIDY LRAHIEEMKK AVTYDGVDLM 
GYTPWGCIDC VSFTTGQYSK RYGFIYVNKH DDGTGDMSRS RKKSFNWYKE VIASNGEKL