Gene SbBS512_E3322 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E3322
Symbol	bglA
ID	6273024
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	3090400
End bp	3091839
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	51%
IMG OID	641727219
Product	6-phospho-beta-glucosidase BglA
Protein accession	YP_001881671
Protein GI	187732371
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAGTGA AAAAACTCAC CTTACCGAAA GATTTCTTAT GGGGTGGCGC CGTTGCCGCT 
CATCAGGTCG AAGGCGGCTG GAACAAAGGC GGCAAAGGAC CGAGCATTTG TGACGTTCTG 
ACCGGTGGCG CACACGGCGT GCCGCGCGAA ATCACCAAAG AAGTCTTGCC AGGAAAATAC 
TATCCAAACC ATGAAGCCGT TGATTTTTAT GGTCACTACA AGGAAGACAT CAAGCTATTT 
GCCGAAATGG GCTTCAAATG TTTTCGGACT TCCATCGCCT GGACGCGTAT TTTTCCAAAA 
GGTGATGAAG CTCAGCCAAA CGAAGAAGGG CTGAAGTTTT ACGACTCTCT GTTCGATGAA 
CTGCTGAAAT ACAACATCGA ACCGGTGATA ACCCTCTCCC ACTTTGAAAT ACCGCTGCAT 
CTGGTGCAGC AATACGGTAG CTGGACCAAC CGTAAAGTCG TTGATTTCTT TGTCCGTTTC 
GCGGAAGTGG TATTCGAACG CTACAAGCAT AAAGTCAAAT ACTGGATGAC CTTCAACGAA 
ATAAACAACC AGCGTAACTG GCGTGCGCCG CTGTTTGGTT ACTGCTGCTC CGGCGTGGTG 
TATACCGAGC ATGACAACCC GGAAGAGACG ATGTACCAGG TGCTGCATCA CCAGTTTGTC 
GCCAGCGCCC TGGCAGTGAA AGCCGCGCGT CGCATTAACC CGGAGATGAA AGTCGGCTGT 
ATGCTGGCGA TGGTGCCGCT CTATCCTTAC TCCTGTAACC CGGACGATGT GATGTTCGCT 
CAGGAGTCGA TGCGCGAACG CTACGTCTTT ACCGATGTGC AGCTACGCGG CTATTACCCG 
TCCTATGTGT TGAACGAGTG GGAGCGTCGC GGATTTAACA TCAAAATGGA AGATGGCGAT 
CTGGATGTAC TGCGTGAAGG CACCTGCGAT TATCTTGGTT TCAGCTATTA CATGATCAAC 
GCAGTGAAGG CCGAAGGCGG CACCGGCGAT GCGATCTCTG GTTTTGAAGG CAGCGTACCG 
AACCCGTATG TTAAAGCGTC TGACTGGGGC TGGCAGATTG ATCCAGTAGG TCTGCGCTAT 
GCCCTTTGCG AACTGTATGA GCGTTATCAG AGGCCGCTGT TTATTGTCGA AAACGGTTTT 
GGCGCTTACG ACAAAGTGGA AGAAGATGGC TGCATCAACG ACGACTACCG CATTGACTAC 
CTGCGCGCCC ATATTGAAGA GATGAAAAAA GCAGTGACTT ACGATGGTGT GGATCTGATG 
GGCTACACAC TGTGGGGCTG CATCGACTGC GTGTCATTCA CTACCGGGCA GTACAGCAAA 
CGCTACGGCT TTATCTATGT GAATAAACAT GACGACGGTA CTGGCGATAT GTCGCGTTCA 
CGTAAGAAGA GCTTTAACTG GTACAAAGAG GTGATTGCCA GCAACGGCGA GAAGCTTTAA

Protein sequence

MIVKKLTLPK DFLWGGAVAA HQVEGGWNKG GKGPSICDVL TGGAHGVPRE ITKEVLPGKY 
YPNHEAVDFY GHYKEDIKLF AEMGFKCFRT SIAWTRIFPK GDEAQPNEEG LKFYDSLFDE 
LLKYNIEPVI TLSHFEIPLH LVQQYGSWTN RKVVDFFVRF AEVVFERYKH KVKYWMTFNE 
INNQRNWRAP LFGYCCSGVV YTEHDNPEET MYQVLHHQFV ASALAVKAAR RINPEMKVGC 
MLAMVPLYPY SCNPDDVMFA QESMRERYVF TDVQLRGYYP SYVLNEWERR GFNIKMEDGD 
LDVLREGTCD YLGFSYYMIN AVKAEGGTGD AISGFEGSVP NPYVKASDWG WQIDPVGLRY 
ALCELYERYQ RPLFIVENGF GAYDKVEEDG CINDDYRIDY LRAHIEEMKK AVTYDGVDLM 
GYTLWGCIDC VSFTTGQYSK RYGFIYVNKH DDGTGDMSRS RKKSFNWYKE VIASNGEKL