Gene B21_03332 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03332
Symbol	bcsZ
ID	8113036
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	3549554
End bp	3550660
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	55%
IMG OID	644849507
Product	hypothetical protein
Protein accession	YP_003001080
Protein GI	251786776
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3405] Endoglucanase Y
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGTGT TGCGTAGTGG AATCGTGACG ATGCTGTTGT TGGCTGCCTT TAGTGTTCAG 
GCCGCCTGTA CCTGGCCTGC CTGGGAGCAG TTTAAAAAGG ATTACATCAG TCAGGAAGGG 
CGCGTCATCG ACCCCAGCGA CGCGCGCAAA ATCACCACCT CCGAAGGGCA AAGTTACGGT 
ATGTTCTTTG CCCTGGCGGC TAACGACCGT GCAGCTTTCG ATAATATTCT CGACTGGACG 
CAGAACAATC TCGCTCAGGG TTCTTTAAAA GAACGTTTGC CCGCCTGGCT GTGGGGCAAG 
AAAGAGAACA GTAAGTGGGA AGTGCTGGAC AGCAATTCGG CCTCCGATGG TGATGTCTGG 
ATGGCCTGGT CGTTGCTGGA GGCGGGGCGT TTGTGGAAAG AGCAGCGTTA TACCGACATC 
GGCAGCGCGT TGCTAAAACG TATCGCGCGG GAGGAAGTGG TGACGGTGCC TGGGCTGGGT 
TCCATGTTGT TACCGGGCAA AGTGGGTTTT GCTGAGGATA ACAGCTGGCG TTTTAACCCC 
AGCTACCTGC CGCCGACGCT GGCGCAGTAT TTCACCCGCT TTGGCGCGCC GTGGACTACG 
CTGCGCGAAA CCAATCAACG TTTATTGCTG GAAACCGCCC CGAAAGGCTT TTCGCCAGAC 
TGGGTGCGCT ATGAGAAAGA CAAAGGCTGG CAGCTAAAAG CCGAAAAAAC ATTGATCAGC 
AGCTACGACG CTATCCGCGT TTACATGTGG GTAGGCATGA TGCCTGACAG CGATCCGCAG 
AAAGCGCGGA TGCTCAACCG GTTTAAACCG ATGGCGACAT TCACTGAGAA AAACGGTTAT 
CCGCCGGAAA AAGTGGATGT GGCTACGGGG AAAGCGCAGG GTAAAGGACC GGTCGGTTTT 
TCTGCCGCCA TGCTGCCCTT TCTACAAAAC CGCGATGCGC AGGCCGTTCA GCGCCAGCGC 
GTGGCCGATA ACTTTCCCGG CAGCGATGCC TATTACAACT ATGTGCTGAC TCTGTTTGGA 
CAAGGCTGGG ATCAACACCG TTTCCGCTTC TCGACAAAAG GTGAGTTATT ACCTGACTGG 
GGCCAGGAAT GCGCAAATTC ACACTAA

Protein sequence

MNVLRSGIVT MLLLAAFSVQ AACTWPAWEQ FKKDYISQEG RVIDPSDARK ITTSEGQSYG 
MFFALAANDR AAFDNILDWT QNNLAQGSLK ERLPAWLWGK KENSKWEVLD SNSASDGDVW 
MAWSLLEAGR LWKEQRYTDI GSALLKRIAR EEVVTVPGLG SMLLPGKVGF AEDNSWRFNP 
SYLPPTLAQY FTRFGAPWTT LRETNQRLLL ETAPKGFSPD WVRYEKDKGW QLKAEKTLIS 
SYDAIRVYMW VGMMPDSDPQ KARMLNRFKP MATFTEKNGY PPEKVDVATG KAQGKGPVGF 
SAAMLPFLQN RDAQAVQRQR VADNFPGSDA YYNYVLTLFG QGWDQHRFRF STKGELLPDW 
GQECANSH