Gene SeHA_C3933 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3933
Symbol	bcsZ
ID	6492301
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	3810535
End bp	3811644
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	56%
IMG OID	642744039
Product	endo-1,4-D-glucanase
Protein accession	YP_002047645
Protein GI	194451286
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3405] Endoglucanase Y
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	84
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGACTA TGCTGCGCGG ATGGATAACG ATGATCGTCA TGCTGACGGC AATAAATGCG 
CAGGCGGCCT GTAGCTGGCC TGCGTGGGAA CAGTTCAAGA AAGATTACAT TAGCCAGCAG 
GGACGCGTTA TCGATCCGGG CGATGCGCGA AAAATTACCA CCTCCGAAGG GCAAAGCTAC 
GCCATGTTCT TTGCCCTGGC GGCGAACGAT CGACCGGCGT TCGCGCAACT GTTTAACTGG 
ACGCAAAACA ATCTGGCGCA GGGATCGCTG CGTGAACATC TGCCCGCCTG GCTGTGGGGA 
CAAAAAGATC CCGACACCTG GTCGGTGCTG GACAGCAACT CCGCGTCCGA CGGCGATATC 
TGGATGGCAT GGTCGCTGCT GGAGGCCGGT CGTCTGTGGA AAGAGACGCG TTATACCGAG 
GTGGGTACGG CGTTGCTAAA ACGCATCGCC CGCGAAGAGG TCGTGAATGT GCCGGGGCTG 
GGCTCAATGC TGCTACCTGG CAAAATCGGC TTTGCCGAGG CGAATAGCTG GCGTTTTAAC 
CCAAGCTATC TGCCGCCGCA GTTGGCGCAA TACTTTAGCC GTTTTGGCGC GCCGTGGTCG 
ACGTTACGGG AAACCAATTT GCGGCTTTTG CTGGAAACCG CGCCGAAAGG TTTCTCGCCG 
GACTGGGTGC GTTATGAAAG CAAGCAAGGC TGGCAGTTGA AAGCGGAAAA GACGCTGATC 
AGTAGCTACG ATGCGATTCG CGTCTATTTA TGGGCGGGAA TGATGCATGA TGGCGATCCG 
CAAAAAGCGC GTTTACTGGC GCGATTTAAA CCGATGGCGA CGTTAACGAT GAAAAACGGC 
GTTCCACCGG AGAAAGTGGA TGTCGTCAGC GGGAATGCGC AAGGGACGGG GCCGGTCGGG 
TTTTCCGCCG CCTTACTGCC TTTCCTGCAA AATCGCGACG CCCAGGCCGT GCAGCGACAG 
CGGGTCGCAG ACCATTTTCC TGGCAGCGAT GCCTATTACA ACTATGTGCT GACTCTCTTT 
GGACAAGGCT GGGATCAGCA CCGTTTTCGC TTCACCGTCA AAGGTGAATT ATTACCTGAC 
TGGGGCCAGG AATGCGTAAG TTCACGTTAA

Protein sequence

MMTMLRGWIT MIVMLTAINA QAACSWPAWE QFKKDYISQQ GRVIDPGDAR KITTSEGQSY 
AMFFALAAND RPAFAQLFNW TQNNLAQGSL REHLPAWLWG QKDPDTWSVL DSNSASDGDI 
WMAWSLLEAG RLWKETRYTE VGTALLKRIA REEVVNVPGL GSMLLPGKIG FAEANSWRFN 
PSYLPPQLAQ YFSRFGAPWS TLRETNLRLL LETAPKGFSP DWVRYESKQG WQLKAEKTLI 
SSYDAIRVYL WAGMMHDGDP QKARLLARFK PMATLTMKNG VPPEKVDVVS GNAQGTGPVG 
FSAALLPFLQ NRDAQAVQRQ RVADHFPGSD AYYNYVLTLF GQGWDQHRFR FTVKGELLPD 
WGQECVSSR