Gene ECD_02733 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_02733
Symbol	bglA
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	2874522
End bp	2875961
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	51%
IMG OID
Product	6-phospho-beta-glucosidase A
Protein accession	ACT44550
Protein GI	253978880
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAGTGA AAAAACTCAC CTTACCGAAA GATTTCTTAT GGGGCGGCGC AGTTGCCGCT 
CATCAGGTCG AAGGCGGCTG GAACAAAGGC GGCAAAGGGC CGAGCATTTG TGACGTTCTG 
ACCGGTGGCG CACACGGCGT GCCGCGCGAA ATCACCAAAG AAGTCTTGCC AGGCAAATAC 
TATCCAAACC ATGAAGCCGT TGATTTTTAT GGTCACTACA AGGAAGACAT CAAGCTATTT 
GCCGAAATGG GCTTCAAATG TTTTCGGACT TCCATCGCCT GGACGCGTAT TTTTCCAAAA 
GGTGATGAAG CTCAGCCAAA CGAAGAAGGG CTGAAGTTCT ACGATGATAT GTTCGATGAA 
CTGCTGAAAT ACAACATCGA ACCGGTGATA ACCCTCTCCC ACTTTGAAAT GCCGCTGCAT 
CTGGTGCAGC AATACGGTAG CTGGACCAAC CGTAAAGTCG TTGATTTCTT TGTCCGTTTC 
GCGGAAGTGG TATTCGAACG CTACAAGCAT AAAGTCAAAT ACTGGATGAC CTTCAACGAA 
ATAAACAACC AGCGTAACTG GCGTGCGCCG CTGTTTGGTT ACTGCTGCTC CGGCGTGGTG 
TATACCGAGC ATGACAACCC GGAAGAGACG ATGTACCAGG TGCTGCATCA CCAGTTTGTC 
GCCAGCGCCC TGGCAGTGAA AGCCGCGCGT CGCATTAACC CGGAGATGAA AGTCGGCTGT 
ATGCTGGCGA TGGTGCCGCT CTATCCCTAC TCCTGTAACC CGGACGATGT GATGTTCGCT 
CAGGAGTCGA TGCGCGAACG CTACGTCTTT ACCGATGTGC AGCTACGCGG CTATTACCCG 
TCCTATGTGT TGAACGAGTG GGAGCGTCGC GGATTTAACA TCAAAATGGA AGATGGCGAT 
CTGGATGTAC TGCGTGAAGG CACCTGCGAT TATCTTGGTT TCAGCTATTA CATGACCAAC 
GCAGTGAAGG CCGAAGGCGG CACCGGCGAT GCGATCTCTG GTTTTGAAGG CAGCGTACCG 
AACCCGTATG TTAAAGCGTC TGACTGGGGC TGGCAGATTG ATCCAGTAGG TCTGCGCTAT 
GCCGTTTGCG AACTGTATGA GCGTTATCAG AGGCCGCTGT TTATTGTCGA AAACGGTTTT 
GGCGCTTACG ACAAAGTGGA AGAAGATGGC AGCATCAACG ACGACTACCG CATTGACTAC 
CTGCGCGCCC ATATTGAAGA GATGAAAAAA GCAGTGACTT ACGATGGTGT GGATCTGATG 
GGCTACACAC CGTGGGGCTG CATCGACTGC GTGTCATTCA CTACCGGGCA GTACAGCAAA 
CGCTACGGCT TTATCTATGT GAATAAACAT GACGACGGTA CTGGCGATAT GTCGCGTTCA 
CGTAAGAAGA GCTTTAACTG GTACAAAGAG GTGATTGCCA GCAACGGCGA GAAGCTTTAA

Protein sequence

MIVKKLTLPK DFLWGGAVAA HQVEGGWNKG GKGPSICDVL TGGAHGVPRE ITKEVLPGKY 
YPNHEAVDFY GHYKEDIKLF AEMGFKCFRT SIAWTRIFPK GDEAQPNEEG LKFYDDMFDE 
LLKYNIEPVI TLSHFEMPLH LVQQYGSWTN RKVVDFFVRF AEVVFERYKH KVKYWMTFNE 
INNQRNWRAP LFGYCCSGVV YTEHDNPEET MYQVLHHQFV ASALAVKAAR RINPEMKVGC 
MLAMVPLYPY SCNPDDVMFA QESMRERYVF TDVQLRGYYP SYVLNEWERR GFNIKMEDGD 
LDVLREGTCD YLGFSYYMTN AVKAEGGTGD AISGFEGSVP NPYVKASDWG WQIDPVGLRY 
AVCELYERYQ RPLFIVENGF GAYDKVEEDG SINDDYRIDY LRAHIEEMKK AVTYDGVDLM 
GYTPWGCIDC VSFTTGQYSK RYGFIYVNKH DDGTGDMSRS RKKSFNWYKE VIASNGEKL