Gene EcHS_A3060 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3060
Symbol	bglA
ID	5593940
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	3071175
End bp	3072614
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	51%
IMG OID	640922177
Product	6-phospho-beta-glucosidase BglA
Protein accession	YP_001459679
Protein GI	157162361
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	75
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAGTGA AAAAACTCAC CTTACCGAAA GATTTCTTAT GGGGCGGCGC AGTTGCCGCT 
CATCAGGTCG AAGGCGGCTG GAACAAAGGC GGCAAAGGGC CGAGCATTTG TGACGTTCTG 
ACCGGTGGCG CACACGGCGT GCCGCGCGAA ATCACCAAAG AAGTCTTGCC AGGCAAATAC 
TATCCAAACC ATGAAGCCGT TGATTTTTAT GGTCACTACA AGGAAGACAT CAAGCTATTT 
GCCGAAATGG GCTTCAAATG TTTTCGGACT TCCATCGCCT GGACGCGTAT TTTTCCAAAA 
GGTGATGAAG CTCAGCCAAA CGAAGAAGGG CTGAAGTTCT ACGATGATAT GTTCGATGAA 
CTGCTGAAAT ACAACATCGA ACCGGTGATA ACCCTCTCCC ACTTTGAAAT GCCGCTGCAT 
CTGGTGCAGC AATACGGTAG CTGGACCAAC CGTAAAGTCG TTGATTTCTT TGTCCGTTTC 
GCGGAAGTGG TATTCGAACG CTACAAGCAT AAAGTCAAAT ACTGGATGAC CTTCAACGAA 
ATAAACAACC AGCGTAACTG GCGTGCGCCG CTGTTTGGTT ACTGCTGCTC CGGCGTGGTG 
TATACCGAGC ATGACAACCC GGAAGAGACG ATGTACCAGG TGCTGCATCA CCAGTTTGTC 
GCCAGCGCCC TGGCAGTGAA AGCCGCGCGT CGCATTAACC CGGAGATGAA AGTCGGCTGT 
ATGCTGGCGA TGGTGCCGCT CTATCCCTAC TCCTGTAACC CGGACGATGT GATGTTCGCT 
CAGGAGTCGA TGCGCGAACG CTACGTCTTT ACCGATGTGC AGCTACGCGG CTATTACCCG 
TCCTATGTGT TGAACGAGTG GGAGCGTCGC GGATTTAACA TCAAAATGGA AGATGGCGAT 
CTGGATGTAC TGCGTGAAGG CACCTGCGAT TATCTTGGTT TCAGCTATTA CATGACCAAC 
GCAGTGAAGG CCGAAGGCGG CACCGGCGAT GCGATCTCTG GTTTTGAAGG CAGCGTACCG 
AACCCGTATG TTAAAGCGTC TGACTGGGGC TGGCAGATTG ATCCAGTAGG TCTGCGCTAT 
GCCCTTTGCG AACTGTATGA GCGTTATCAG AGGCCGCTGT TTATTGTCGA AAACGGTTTT 
GGCGCTTACG ACAAAGTGGA AGAAGATGGC AGCATCAACG ACGACTACCG CATTGACTAC 
CTGCGCGCCC ATATTGAAGA GATGAAAAAA GCAGTGACTT ACGATGGTGT GGATCTGATG 
GGCTACACAC CGTGGGGCTG CATCGACTGC GTGTCATTCA CTACCGGGCA GTACAGCAAA 
CGCTACGGCT TTATCTATGT GAATAAACAT GACGACGGTA CTGGCGATAT GTCGCGTTCA 
CGTAAGAAGA GCTTTAACTG GTACAAAGAG GTGATTGCCA GCAACGGCGA GAAGCTTTAA

Protein sequence

MIVKKLTLPK DFLWGGAVAA HQVEGGWNKG GKGPSICDVL TGGAHGVPRE ITKEVLPGKY 
YPNHEAVDFY GHYKEDIKLF AEMGFKCFRT SIAWTRIFPK GDEAQPNEEG LKFYDDMFDE 
LLKYNIEPVI TLSHFEMPLH LVQQYGSWTN RKVVDFFVRF AEVVFERYKH KVKYWMTFNE 
INNQRNWRAP LFGYCCSGVV YTEHDNPEET MYQVLHHQFV ASALAVKAAR RINPEMKVGC 
MLAMVPLYPY SCNPDDVMFA QESMRERYVF TDVQLRGYYP SYVLNEWERR GFNIKMEDGD 
LDVLREGTCD YLGFSYYMTN AVKAEGGTGD AISGFEGSVP NPYVKASDWG WQIDPVGLRY 
ALCELYERYQ RPLFIVENGF GAYDKVEEDG SINDDYRIDY LRAHIEEMKK AVTYDGVDLM 
GYTPWGCIDC VSFTTGQYSK RYGFIYVNKH DDGTGDMSRS RKKSFNWYKE VIASNGEKL