Gene BCG9842_B5631 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCG9842_B5631
Symbol	celF
ID	7182883
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus G9842
Kingdom	Bacteria
Replicon accession	NC_011772
Strand	-
Start bp	5071476
End bp	5072801
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	38%
IMG OID	643553096
Product	6-phospho-beta-glucosidase
Protein accession	YP_002448737
Protein GI	218900326
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1486] Alpha-galactosidases/6-phospho-beta-glucosidases, family 4 of glycosyl hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.00000000000180851
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACTGGAA TTAAAATTGC TACAATCGGC GGTGGATCTA GTTATACACC AGAGTTAATT 
GAAGGATTTA TTAAACGTTA TGATGAGCTT CCTGTTCGTG AAATTTGGTT AGTAGATATT 
GAGGCAGGAA AAGAAAAGTT AGAAATTGTT GGTAACTTAG CGAAACGTAT GGTGAAAAAA 
TCTGGTTTAC CAATCGAGGT ACATTTAACA CTTGATCGCC GTGAGGCATT AAAAGATGCA 
GACTTCGTAA CAACACAACT TCGCGTTGGT TTATTAGAAG CACGTGCAAA AGATGAAGCA 
ATCCCATTAA AATATGATGT AATCGGTCAG GAAACGAATG GTCCTGGTGG TTTATTCAAA 
GCACTGAGAA CGATTCCTGT TATTTTAGAT ATTTGTAAAG ATATGGAGGA GCTTTGTCCG 
AATGCATGGC TAATTAACTT TGCGAACCCA GCTGGTATGG TAACAGAAGC TGTCCTTCGT 
TATACAAATA TTCAAAGAGT AGTTGGTCTA TGTAACGTTC CAATCGGAAT CCGCATGGGT 
CTTGCAAGAT TACTTGAAGT AGATGCAAGT CGTGTCCACG TTGATTTTGC AGGTTTAAAT 
CATATGGTAT ACGGACTAGA TGTATACTTA GATGGCGTAA GTGTAATGGA TCGTGTGTTA 
GAGCTTGTAA CAGATCCGGA AAAGCAAATT ACGATGGAAA ATATCGCAGC GCTTAACTGG 
GAACCAGACT TTATTCGCGG CCTTCGTGCA ATTCCATGTC CATATCATCG TTATTACTAC 
AAAACACGTG AAATGTTAGA AGAAGAAAAA GAAGCTTCTG TTGAAAAAGG TACACGTGCA 
GAAGTAGTAA AACAATTAGA AAATGATTTA TTTGAGTTAT ATAAAGACCC GAATTTAGAT 
ATTAAACCAC CACAATTAGA AAAACGTGGC GGCGCTTATT ATAGTGACGC AGCATGTAGC 
TTAATTACGT CTATTTACAA CAATAAAGGT GATATCCAGC CTGTTAATAC ACGAAACAAC 
GGAACAATTG CAAGCTTACC AGATGATTCT GCTGTTGAAG TGAACTGTAT TATTACGAAA 
GAAGGTCCAA AACCAATTGC GGTCGGAGAT CTTCCAGTAC CAGTTCGCGG TTTAGTACAG 
CAAATTAAAT CATTTGAGCG CACAACAATT GAAGCTGCTG TTACAGGTGA TTATCATAAA 
GCGCTGCTTG CTATGACAAT TAATCCACTT GTACCATCAG ATACAGTTGC AAGACAAATT 
TTAGATGAAA TGTTGGAAGC ACATAAAGAA TATCTTCCGC AGTTCTTCAA AAAGGTAGAG 
AAGTAA

Protein sequence

MTGIKIATIG GGSSYTPELI EGFIKRYDEL PVREIWLVDI EAGKEKLEIV GNLAKRMVKK 
SGLPIEVHLT LDRREALKDA DFVTTQLRVG LLEARAKDEA IPLKYDVIGQ ETNGPGGLFK 
ALRTIPVILD ICKDMEELCP NAWLINFANP AGMVTEAVLR YTNIQRVVGL CNVPIGIRMG 
LARLLEVDAS RVHVDFAGLN HMVYGLDVYL DGVSVMDRVL ELVTDPEKQI TMENIAALNW 
EPDFIRGLRA IPCPYHRYYY KTREMLEEEK EASVEKGTRA EVVKQLENDL FELYKDPNLD 
IKPPQLEKRG GAYYSDAACS LITSIYNNKG DIQPVNTRNN GTIASLPDDS AVEVNCIITK 
EGPKPIAVGD LPVPVRGLVQ QIKSFERTTI EAAVTGDYHK ALLAMTINPL VPSDTVARQI 
LDEMLEAHKE YLPQFFKKVE K