Gene SeSA_A3812 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A3812
Symbol	bcsZ
ID	6516631
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	-
Start bp	3681391
End bp	3682500
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	56%
IMG OID	642748790
Product	endo-1,4-D-glucanase
Protein accession	YP_002116554
Protein GI	194735770
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3405] Endoglucanase Y
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.370483
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGACTA TGCTGCGCGG ATGGATAACG ATGCTCGTCA TGCTGACGGC AATAAATGCG 
CAGGCAGCCT GTAGCTGGCC TGCGTGGGAA CAGTTCAAGA AAGATTACAT TAGCCAGCAG 
GGACGCGTTA TCGATCCGGG CGATGCGCGA AAAATTACCA CCTCCGAAGG GCAAAGCTAC 
GCCATGTTCT TTGCCCTGGC AGCGAACGAT CGACCGGCGT TCGCGCAACT GTTTAACTGG 
ACGCAAAACA ATCTGGCGCA GGGATCGCTG CGTGAACATC TGCCCGCCTG GCTGTGGGGG 
CAAAAAGATC CCGACACCTG GTCGGTGCTG GACAGCAACT CCGCGTCCGA CGGCGATATC 
TGGATGGCAT GGTCGCTGCT GGAGGCCGGT CGTCTGTGGA AAGAGACGCG TTATACCGAG 
GTGGGCACGG CGTTGCTAAA ACGCATCGCC CGCGAAGAGG TCGTGAATGT GCCGGGGCTG 
GGCTCAATGC TGCTACCTGG CAAAATCGGC TTTGCCGAGG CGAATAGCTG GCGTTTTAAC 
CCAAGCTATC TGCCGCCGCA GTTGGCGCAA TACTTTAGCC GTTTTGGCGC GCCGTGGTCG 
ACGCTACGGG AAACCAATTT GCGGCTTTTG CTGGAAACCG CGCCGAAAGG TTTCTCGCCG 
GACTGGGTGC GTTATGAAAG CAAGCAAGGC TGGCAGTTGA AAGCGGAAAA GACGCTGATC 
AGTAGCTACG ATGCGATTCG CGTCTATTTA TGGGCGGGAA TGATGCATGA TGGCGATCCG 
CAAAAAGCGC GTTTACTGGC GCGATTTAAA CCGATGGCGA CGTTAACGAT GAAAAACGGC 
GTTCCACCGG AGAAAGTGGA TGTCGTCAGC GGGAACGCGC AAGGGACGGG GCCGGTCGGG 
TTTTCCGCCG CCTTACTGCC TTTCCTGCAA AATCGCGACG CCCAGGCCGT GCAGCGACAG 
CGGGTCGCAG ACCATTTTCC TGGCAGCGAT GCCTATTACA ACTATGTGCT GACTCTCTTT 
GGACAAGGCT GGGATCAGCA CCGTTTTCGC TTCACCGTCA AAGGTGAATT ATTACCTGAC 
TGGGGCCAGG AATGCGTAAG TTCACGTTAA

Protein sequence

MMTMLRGWIT MLVMLTAINA QAACSWPAWE QFKKDYISQQ GRVIDPGDAR KITTSEGQSY 
AMFFALAAND RPAFAQLFNW TQNNLAQGSL REHLPAWLWG QKDPDTWSVL DSNSASDGDI 
WMAWSLLEAG RLWKETRYTE VGTALLKRIA REEVVNVPGL GSMLLPGKIG FAEANSWRFN 
PSYLPPQLAQ YFSRFGAPWS TLRETNLRLL LETAPKGFSP DWVRYESKQG WQLKAEKTLI 
SSYDAIRVYL WAGMMHDGDP QKARLLARFK PMATLTMKNG VPPEKVDVVS GNAQGTGPVG 
FSAALLPFLQ NRDAQAVQRQ RVADHFPGSD AYYNYVLTLF GQGWDQHRFR FTVKGELLPD 
WGQECVSSR